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PROCEDE DE DISSOCIATION DE LA MOLECULE D'HEMOGLOBINE 
EXTRACELLULAIRE WARENICOLA MARINA, CARACTERISATION DES 
CHAlNES PROTEIQUES CONSTITUANT LADITE MOLECULE ET DES 
SEQUENCES NUCLEOTIDIQUES CODANT POUR LESDITES CHAlNES 
PROTEIQUES 

La presente invention a pour objet un procede de dissociation de la molecule 
d'hemoglobine extracellulaire d' Annelides, notamment d'Arenicola marina, ainsi que la 
caracterisation des chaines proteiques constituant ladite molecule. 

La presente invention a egalement pour objet la caracterisation des sequences 
nucleotidiques codant pour les chaines proteiques susmentionnees, ainsi que le procede 
de preparation de ces sequences nucleotidiques. 

Le sang est un liquide complexe dont la fonction principale est de transporter 
l'oxygene et le gaz carbonique, afin d' assurer les processus respiratoires. C'est la 
molecule d'hemoglobine, que Ton trouve dans les hematies, qui assure cette fonction. 

La molecule d'hemoglobine de mammifere est formee par l'assemblage de quatre 
chaines polypeptidiques fonctionnelles semblables deux a deux (2 chaines de globine de 
type a et 2 chaines de globine de type P). Chacune de ces chaines polypeptidiques 
possede la meme structure tertiaire d'une molecule de myoglobine (Dickerson et Geis, 
1983). 

L'heme, site actif de l'hemoglobine, est un anneau protoporphyrinique 
tetrapyrrolique, contenant en son centre un unique atome de fer. L'atome de fer, fixateur 
de Toxygene, etablit 6 liaisons de coordinence : quatre avec les atomes d'azote de la 
porphyrins une avec l'histidine proximale F8 et une avec la molecule d'oxygene lors de 
Toxygenation de la globine. 

On est actuellement confronte aux problemes d' appro visionnement de sang, dus a 
la diminution des dons du sang par peur de contamination. Ainsi, la recherche de 
substituts sanguins s'est acceleree au cours des dernieres annees. On cherche a 
concevoir des substituts sanguins artificiels capables d'eliminer les risques de 
transmission de maladies infectieuses, mais egalement a s'affranchir des problemes de 
compatibility des groupes sanguins. 
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Jusqu'a present, les principales voies de recherche concernent la synthese de 
produits chimiques d'une part (Clark et Gollan, 1966) et la synthese de produits 
biologiques d'autre part (Chang, 1957 ; Chang, 1964). 

En ce qui concerne la premiere voie de recherche, on a utilise les 
perfluorocarbones (PFC). Les PFC sont des produits chimiques capables de transporter 
l'oxygene et ils peuvent dissoudre une grande quantite de gaz, comme l'oxygene et le 
dioxyde de carbone. 

Actuellement, on essaye de produire des 6mulsions de ces produits qui pourraient 
etre disperses dans le sang d'une facon plus efficace (Reiss, 1991 ; Reiss, 1994 ; Goodin 
etal., 1994). 

L'avantage des PFC demeure dans leur capacite oxyphorique directement 
proportionnelle a la quantite d'oxygene se trouvant dans les poumons. Par ailleurs, en 
raison de 1' absence de membrane a traverser, les PFC peuvent transporter l'oxygene 
plus rapidement vers les tissus. Toutefois, on ne connait pas les effets a long terme de la 
retention de ces produits dans l'organisme. Lorsque ces produits ont ete utilises pour la 
premiere fois comme substitut sanguin dans les annees 1960 chez la souris (Clark et 
Gollan, 1966 ; Geyer et al., 1966 ; Sloviter et Kamimoto, 1967), les effets secondares 
ont ete tres importants. Les PFC n'etaient pas elimines de la circulation d'une facon 
satisfaisante et s'accumulaient dans les tissus de l'organisme, ce qui provoquait des 
oedemes. 

Dans les annees 1980, on a teste une nouvelle version de PFC en phase clinique. 
Mais les problemes de stockage, de cout financier, d'effets secondaires non negligeables 
et la faible efficacite de ce compost ont empechS l'extension de sa commercialisation 
(Naito, 1978 ; Mitsuno et Naito, 1979 ; Mitsuno et Ohyanagi, 1985). 

Recemment, on a mis au point une nouvelle generation de PFC (PFBO 
perfluorooctylbromide). Un nouveau produit (Reiss, 1991) est en cours de test clinique 
aux Etats-Unis, mais on a deja constate qu'une augmentation de la quantite d'oxygene 
dans le sang peut engendrer une accumulation d'oxygene dans les tissus, ce qui est 
dangereux pour l'organisme (formation d'oxygene radicalaire de type superoxyde). 

Ainsi, malgre les progres realises au fur et a mesure, les effets secondaires de ces 
composes sont encore trop importants pour etre commercialises a grande echelle. 

En ce qui concerne la deuxieme voie de recherche, des chercheurs ont travaille sur 
la mise au point de substituts sanguins en modifiant la structure de l'hemoglobine 
naturelle (Chang, 1957 ; Chang, 1997). Pour obtenir un substitut sanguin de type 
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hemoglobine modifiee, on utilise des hemoglobines synthetisees par des 
microorganismes genetiquement modifies, ou d'origine humaine ou animale, 
notamment la molecule d'hemoglobine bovine. En effet, l'hemoglobine bovine est 
legerement differente de l'hemoglobine humaine sur le plan immunologique, mais elle 
transporte plus facilement l'oxygene vers les tissus. N6anmoins, le risque de 
contamination virale ou de type encephalopathie spongiforme reste toujours important. 

Pour etre fonctionnelle, l'hemoglobine doit etre en contact avec un effecteur 
allosterique le 2,3-diphosphoglycerate (2,3-DPG), present uniquement a l'interieur des 
globules rouges (Dickerson et Geis, 1983). De plus, sans le 2,3-DPG et d'autres 
elements presents dans les globules rouges comme la methemoglobine reductase, 
l'hemoglobine subit un processus d'auto-oxydation et perd sa capacite a transporter de 
l'oxygene ou du dioxyde de carbone. 

On peut eliminer ces processus en modifiant la structure de l'hemoglobine, et plus 
precisement en stabilisant les liaisons faibles de la molecule tetramerique entre les deux 
dimeres a et p (Chang, 1971). De nombreuses modifications ont ete testees : liaison 
covalente entre deux chaines a, entre deux chaines p ou encore entre a et p (Payne, 
1973 ; Bunn et Jandl, 1968). 

On a egalement tente de polymeriser les molecules tetrameriques ou de les 
conjuguer avec un polymere nomme polyethylene glycol (PEG)(Nho et al., 1992). Ces 
modifications ont pour consequence de stabiliser la molecule et d'augmenter sa taille, 
empechant son elimination par les reins. 

On a beaucoup etudie les Annelides pour leur hemoglobine extracellulaire 
(Terwilliger, 1992 ; Lamy et al., 1996). Ces molecules d'hemoglobine extracellulaire 
sont presentes chez les trois classes d'Ann61ides : Polychetes, Oligochetes et Achetes et 
m6me chez les Vestimentiferes. Ce sont des biopolymeres geants, constitues d' environ 
200 chaines polypeptidiques appartenant a 6 ou 8 types differents que l'on regroupe 
generalement en deux categories. La premiere categorie, comptant 144 a 192 elements, 
regroupe les chaines polypeptidiques dites "fonctionnelles" portant un site actif et 
capables de lier reversiblement l'oxygene ; ce sont des chaines de type globine dont les 
masses sont comprises entre 15 et 18 kDa et qui sont tres similaires aux chaines de type 
a et P de vertebres. La deuxieme categorie, comptant 36 a 42 elements, regroupe les 
chaines polypeptidiques dites de "structure" possedant peu ou pas de site actif mais 
permettant l'assemblage des douziemes. 
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Les premieres images obtenues sur des hemoglobines extracellulaires d'Arenicole 
(Roche et al., 1960) ont revele des structures hexagonales. Chaque molecule 
d'hemoglobine est constituee de deux hexagones superposes (Levin, 1963 ; Roche, 
1965) que 1'on dit en "bicouche hexagonale" (hexagonal bilayer) et chaque hexagone est 
lui-meme forme par l'assemblage de six elements en forme de goutte d'eau (Van 
Bruggen et Weber, 1974 ; Kapp et Crewe, 1984), nommes structure globulaire creuse 
(hollow globular structure)(De Haas et al., 1996) ou "douzieme". La molecule native est 
formee de douze de ces sous-unites, d'une masse moleculaire d'environ 250 kDa. 

Ainsi, le brevet francais n°2 809 624 concerne l'utilisation comme substitut 
sanguin d'hemoglobine extracellulaire d'Arenicola marina, un Annelide Polychete de 
l'ecosysteme intertidal, ledit substitut sanguin permettant d'eliminer les problemes de 
penurie de dons. 

Bien que 1' architecture globale de l'hemoglobine de Arenicola marina soit 
connue, notamment grace a son etude quatemaire fine par spectrometrie de masse (Zal 
et al., 1997), les sequences primaires des differentes chaines proteiques qui la 
composent ne le sont pas. 

Ainsi, la presente invention a pour but de fournir les sequences proteiques qui 
composent la molecule d'hemoglobine d'Arenicola marina. 

Un autre but de la presente invention consiste a fournir les premieres etapes de la 
synthese in vitro d'hemoglobine extracellulaire d'Arenicola marina afin d'elaborer un 
substitut sanguin au moyen de precedes de biochimie et de biologie moleculaire. 

Un autre but de la presente invention consiste a fournir un precede de preparation 
de la molecule d'hemoglobine, eventuellement simplifiee, par genie genetique, et ce 
afin notamment d'augmenter le stock de cette molecule dans le cadre d'une utilisation 
comme substitut sanguin. 

La presente invention concerne un precede de dissociation de la molecule 
d'hemoglobine extracellulaire d'Annelides, notamment d'Arenicola marina, permettant 
l'obtention des chaines proteiques constituant ladite molecule, 

ledit precede etant caracterise en ce qu'il comprend une etape de mise en presence 
d'un echantillon d'hemoglobine extracellulaire d'Annelides, notamment d'Arenicola 
marina avec au moins un agent dissociant, notamment un melange constitu6 de 
dithiothreitol (DTT) ou de chlorhydrate de tris(2-carboxyethyl)phosphine (TCEP) ou de 
beta-mercaptoethanol et d'un tampon de dissociation, pendant un temps suffisant pour 
separer les chaines protdiques les unes des autres. 
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La presente invention concerne un procede d'obtention des chaines proteiques 
constituant la molecule d'hemoglobine extracellulaire d'Annelides, notamment 
d'Arenicola marina, 

ledit procede etant caract6rise en ce qu'il comprend une etape de mise en presence 
d'un echantillon d'hemoglobine extracellulaire d'Annelides, notamment d'Arenicola 
marina avec au moins un agent dissociant, et le cas echeant un agent reducteur, 
notamment un melange constitue de dithiothreitol (DTT) ou de chlorhydrate de tris(2- 
carboxyethyl)phosphine (TCEP) ou de beta-mercaptoethanol et d'un tampon de 
dissociation, pendant un temps suffisant pour separer les chaines proteiques les unes des 
autres. 

Par "hemoglobine extracellulaire", on designe une hemoglobine non contenue 
dans les cellules et dissoute dans le sang. 

L'expression "dissociation" designe un traitement chimique capable de rompre les 
interactions faibles (hydrophobes, electrostatiques, hydrogenes...). 

Par "tampon de dissociation", on designe un liquide contenant un tampon 
permettant d'ajuster le pH et contenant des agents dissociants. 

L'expression "agent dissociant" designe un compose chimique capable de rompre 
les interactions faibles (hydrophobes, electrostatiques, hydrogenes...)- Ledit agent 
dissociant est notamment choisi parmi : les ions hydroxydes, l'uree ou des ions 
heteropolytungstates ou des sels de guanidinium ou du SDS (sodium dodecyl sulfate). 

L'expression "reduction" designe un traitement chimique capable de rompre les 
interactions fortes telles que les ponts disulfides. 

L'expression "agent reducteur" designe un compose chimique capable de rompre 
les interactions fortes telles que les ponts disulfides. 

Les dix chaines proteiques constituant la molecule d'hemoglobine extracellulaire 
d'Arenicola marina comprennent 8 chaines de type globine et 2 chaines de. type 
structure. 

On rappelle que l'hemoglobine extracellulaire de Arenicola marina d'une masse 
de 3648 ± 24 kDa est constituee de 198 chaines polypeptidiques appartenant a 10 types 
differents regroupes en deux categories : 

- la premiere (156 chaines) regroupe des chaines polypeptidiques dites 
"fonctionnelles" portant un site actif capable de lier reversiblement l'oxygene ; ce sont 
des chaines de type globine dont les masses sont comprises entre 15 et 18 kDa ; ces 
chaines sont tres similaires aux chaines de types a et p des vertebres ; et 
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- la deuxieme (42 chaines) regroupe des chaines polypeptidiques dites de 
"structure" (ou "linker") possedant peu ou pas de site actif mais permettant 1' assemblage 
des dodecameres ; ces chaines ont des masses moleculaires comprises entre 22 et 27 
kDa. 

La presente invention conceme un precede de dissociation de la molecule 
d'hemoglobine extracellulaire d'Arenicola marina, permettant l'obtention des chaines 
proteiques constituant ladite molecule, 

ledit precede etant caracteris6 en ce qu'il comprend une etape de mise en presence 
d'un echantillon d'hemoglobine extracellulaire d'Arenicola marina avec un melange 
constitue de dithiothreitol (DTT) et d'un tampon de dissociation, pendant environ une 
heure a trois semaines. 

Un precede de dissociation avantageux de l'invention est caracterise en ce que le 
tampon de dissociation comprend un agent tamponnant a une concentration comprise 
d'environ 0,05 M a environ 0,1 M, notamment du Trisma 
(tris[hydroxymethyl]aminom6thane), de l'hepes, du phosphate de sodium, du borate de 
sodium, du bicarbonate d'ammonium ou de l'acetate d'ammonium, et 0 a 10 mM 
d'EDTA ajuste aunpH compris d'environ 5 a environ 12, et de preference d'environ 
7,5 a 12, le tout etant notamment ajuste a un pH compris d'environ 2 a 12, et de 
preference d'environ 5 a 12. 

De preference, ledit tampon de dissociation comprend de 1'EDTA a une 
concentration d'environ 1 mM ajuste a un pH d'environ 10, notamment avec une 
solution de soude 2N. 

Selon un mode de realisation avantageux, le precede de l'invention est caracterise 
en ce que les chaines proteiques constituant ladite molecule sont obtenues par la 
reduction de quatre sous-unites par un agent reducteur, par exemple en presence de 
DTT, lesdites sous-unites etant elles-memes obtenues par mise en presence d'un 
echantillon d'hemoglobine extracellulaire d'Arenicola marina avec differents agents 
dissociants, notamment un tampon de dissociation. 

La molecule native se dissocie en sous-unites sous Taction d'agents dissociants 
non reducteurs. II n'y a done pas rupture des liaisons covalentes. Toutefois, apres 
Taction d'un agent reducteur (coupure des liaisons covalentes), les sous-unites sont 
reduites en chaines polypeptidiques (chaines proteiques constitutes de l'assemblage 
d'acides amines). 
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Les 4 sous-unites susmentionnees sont done : les monomeres, les dimeres, les 
trimeres et les dodecameres. 

Les monomeres sont des chaines de globine. 

Les dimeres sous forme homo et heterodimeres sont des chaines de structure. 

Les trimeres sont des assemblages covalents de trois chaines de globine. 

Les dodecameres sont constitues de 12 chaines proteiques ; par exemple : 
3 trimeres + 3 monomeres, 2 trimeres + 6 monomeres, 1 trimere + 9 monomeres. 

On peut done obtenir les chaines proteiques soit en une seule etape par reduction 
directe de l'hemoglobine extracellulaire d'Arenicola marina, soit en deux etapes, Tune 
consistant en la dissociation de l'hemoglobine extracellulaire d'Arenicola marina en 4 
sous-unites et l'autre en la r6duction desdites 4 sous-unites en chaines proteiques. 

La presente invention concerne egalement un procede de dissociation tel que 
defini ci-dessus, caracterise en ce que les agents dissociants utilises pour obtenir les 4 
sous-unites susmentionnees sont les suivants : 

- une solution tampon de dissociation comprenant : 0,1 M de base Trisma 
(tris[hydroxym6thyl]aminomethane) et 0 a 10 mM d'EDTA ajuste a un pH 
compris d'environ 5 a environ .12, et de preference d'environ 7,5 a environ 12, et 

- une solution d'uree dont la concentration est comprise d'environ 0,1 M a 
environ 8 M, et est notamment egale a 3 M. 

La presente invention concerne egalement un procede de dissociation tel que 
defini ci-dessus, caracterise en ce que les agents dissociants pour obtenir les 4 sous- 
unites sont les suivants : 

- une solution tampon de dissociation comprenant 0,1 M de base Trisma et 1 
mM d'EDTA ajuste a pH 10, et 

- 3 M d'uree. 

La presente invention concerne egalement un procede de dissociation et DE 
reduction tel que defini ci-dessus, caracteris6 en ce que les agents dissociants et 
reducteurs utilises pour obtenir les chaines proteiques sont les suivants : 

- une solution tampon de dissociation comprenant : 0,1 M de base Trisma 
(tris[hydroxymethyl]aminomethane) a un pH compris d'environ 8 a environ 9, et 

- une solution d'uree dont la concentration est comprise d'environ 4 M a environ 
8 M, et est notamment egale a 8 M, et 

- lal0%DTT 
ou 
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- une solution tampon de dissociation comprenant : 0,1 M de bicarbonate 
d'ammonium a un pH compris d'environ 8 a environ 9,«et 

- 1 a 10%DTT 

Le procede de dissociation et de reduction de l'invention permet d'obtenir une 
composition contenant le melange des chaines proteiques constituant la molecule 
d'hemoglobine extracellulaire d'Arenicola marina. 

La presente invention concerne egalement un proc6de de preparation de couples 
d'amorces a partir des chaines proteiques telles qu'obtenues selon le procede tel que 
defini ci-dessus, ledit procede etant caracterise en ce qu'il comprend les etapes 
suivantes : 

- l'isolement de chacune des chaines proteiques constituant la molecule 
d'hemoglobine telles qu'obtenues selon le procede tel que defini ci-dessus, 

- le microsequencage de chacune des chaines proteiques isolees susmentionnees 
par spectrometrie de masse et sequencage d'Edman, afin d'obtenir une microsequence 
correspondant a chacune des sequences constitutes de 5 a 20 acides amines, et 

- la determination des amorces degenerees a partir des microsequences 
susmentionnees. 

La premiere etape d'isolement des chaines proteiques est notamment effectu6e par 
chromatographie liquide en phase inverse et gel bidimensionnel a partir du melange 
susmentionne comprenant les chaines proteiques constituant la molecule d'hemoglobine 
telles qu'obtenues selon le procede de dissociation et de r6duction de l'invention. 

L'expression "microsequence" designe des fragments de sequences proteiques. 

Les microsequences susmentionnes peuvent provenir a la fois des extr&nites C- et 
N-terminales mais aussi de sequences internes. 

Les chaines proteiques peuvent etre obtenues par chromatographie liquide en 
phase inverse ou a partir de gel 2D a partir d'hemoglobine purifiee d'Arenicola marina. 
Chaque pic ou tache a ete decoupe et digere par une protease. Les peptides ainsi obtenus 
ont et6 extraits des gels et separes par capLC (chromatographie liquide capillaire). Les 
fragments sont ensuite analyses par spectrometrie de masse. D'autre part, chaque pic 
isole par phase inverse a ete analyse par sequencage d'Edman. 

L'expression "amorces degenerees" designe des sequences nucleotidiques 
obtenues a partir de fragments de sequences proteiques. On parle d'amorces degenerees 
en raison de la degendrescence du code genetique (plusieurs codons pour 1 acide 
amine). 
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La derniere etape de determination des couples d' amorces degenerees correspond 
a leur synthese. 

Cette etape permet d'obtenir a la fois des amorces sens et des amorces antisens. 
La presente invention conceme egalement des couples d'amorces tels qu'obtenus 
selon le precede tel que defini ci-dessus, lesdits couples etant notamment les suivants : 

a) Amorce sens : GAR TGY GGN CCN TTR CAR CG (SEQ ID NO : 21) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO: 22) 

b) Amorce sens : TGY GGN ATH CTN CAR CG (SEQ ID NO: 23) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO: 22) 

c) Amorce sens : AAR GTI AAR CAN AAC TGG (SEQ ID NO : 24) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22) 

d) Amorce sens : TGY TGY AGY ATH GAR GAY CG (SEQ ID NO: 25) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ED NO : 22) 

e) Amorce sens : AAR GTN ATH TTY GGN AGR GA (SEQ ID NO : 26) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ED NO : 22) 

f) Amorce sens: gar CAY CAR TGY GGN GGN GA (SEQ ID NO: 27) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22) 

ou : 

R represente A ou G, 
Y represente C ou T, 
N represente A, G, C ou T, 
I represente l'inosine, 
H represente A, C ou T. 

La presente invention conceme egalement des couples d'amorces tels qu'obtenus 
selon le procede tel que defini ci-dessus, lesdits couples etant notamment les suivants : 

a) Amorce sens : GAR TGY GGN CCN TTR CAR CG SEQ ID NO : 21 
Amorce antisens : CCA NGC NTC YTT RTC RAA GCA SEQ ID NO : 28 

b) Amorce sens : AN TGY GGN CCN CTN CAR CG SEQ ID NO : 29 
Amorce antisens : CCA NGC NTC YTT RTC RAA GCA SEQ ID NO : 28 

c) Amorce sens : AAR GTI AAR CAN AAC TGG SEQ ED NO : 24 
Amorce antisens : CCA NGC NCC DAT RTC RAA SEQ ED NO : 30 

d) Amorce sens : TGY TGY AGY ATH GAR GAY CG SEQ ED NO : 25 
Amorce antisens : CA NGC NYC RCT RTT RAA RCA SEQ ED NO: 31 
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ou : 

R represente A ou G, 
Y represente C ou T, 
N represente A, G, C ou T, 
I represente Tinosine, 
D represente A, G ou T, 
H represente A, C ou T. 

La presente invention conceme egalement un procede de preparation de sequences 
nucleotidiques codant pour les chaines proteiques constituant la molecule 
d'hemoglobine d'Arenicola marina, a partir des amorces telles qu'obtenues selon le 
procede tel que defini ci-dessus, ledit procede etant caracterise en ce qu'il correspond a 
un procede d' amplification en chaine par polymerase (PCR), comprenant une repetition 
d'au moins 30 fois du cycle constitue par les etapes suivantes : 

* la denaturation, par chauffage, de l'ADNc monocatenaire codant pour une 
des chaines proteiques constituant la molecule d'hemoglobine d'Arenicola 
marina, de fa?on a denaturer d'eventuelles structures secondaires et des reliquats 
d'ARN, ledit ADNc etant obtenu a partir d'ARNm, cette 6tape permettant 
d'obtenir des brins d' ADNc monocatdnaires denatures, 

* rhybridation des couples d'amorces tels qu'obtenus par le procede tel que 
defini ci-dessus aux brins d' ADNc monocatenaires denatures susmentionnes a une 
temperature adequate, pour obtenir des amorces hybridees, et 

* la synthase du brin complementaire de TADNc par une polymerase a une 
temperature adequate, a partir des amorces hybridees telles qu'obtenues a l'etape 
precedente. 

L' ADNc codant pour les chaines proteiques susmentionnees est obtenu a partir 
d'ARNm, ledit ARNm etant obtenu par purification a partir d*ARN totaux extraits sur 
des Arenicoles juveniles en pleine croissance, lesdits Ar6nicoles juveniles presentant un 
taux eleve de transcription des differents ARN messagers. 

Si le cycle susmentionne est repete moins de 30 fois, 1' amplification de l'ADN est 
reduite. 

L'expression "eventuelles structures secondaires" designe des appariements 
anarchiques entre deux sequences d' ADNc. 
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L'expression "denaturation par chauffage de l'ADNc" designe la rapture des 
appariements anarchiques entre deux sequences d'ADNc. 

L'expression "hybridation a une temperature adequate" designe la reconnaissance 
par les amorces de leurs sequences compl&nentaires sur l'ADN matrice. 

Selon un mode de realisation avantageux, le procede de preparation de sequences 
nucleotidiques selon l'invention est caracterise en ce que : 

- la premiere etape dudit procede est une etape de denaturation de l'ADNc 
codant pour une des chaines proteiques constituant la molecule d'hemoglobine 
d'Arenicola marina d'environ 10 secondes a environ 5 minutes a une temperature 
comprise d'environ 90°C a environ 1 10°C, 

- le cycle, repet6 environ 30 a 40 fois, comprend les etapes suivantes : 

* une etape de denaturation de l'ADNc codant pour une des chaines proteiques 
constituant la molecule d'hemoglobine d'Arenicola marina d'environ 10 
secondes a environ 5 minutes, a une temperature comprise d'environ 90°C a 
environ 110°C, 

* une etape d'hybridation des couples d'amorces de l'invention aux brins 
d'ADNc monocatenaires susmentionnes pour obtenir des amorces 
hybridees, d'environ 20 secondes a environ 2 minutes, a une temperature 
comprise d'environ 50°C a environ 60°C, de preference d'environ 50°C a 
environ 56°C, 

* une etape d' elongation des amorces hybridees telles qu'obtenues 
precedemment par une polymerase d'environ 20 secondes a environ 1 
minute et 30 secondes, a une temperature comprise d'environ 70°C a 
environ 75°C, et 

- la derniere 6tape du procede est une etape d' elongation des amorces hybridees 
telles qu'obtenues precedemment par une polymerase d'environ 5 minutes a environ 
15 minutes a une temperature comprise d'environ 70°C a environ 75°C. 

La reaction de PCR du procede de l'invention est notamment effectuee en 
presence d'ADNc (5 a 20 ng), d'amorce sens (100 ng) et antisens (100 ng), de dNTP 
(200 uM final), de MgCl 2 (2 mM final), de tampon PCR (foumi avec la polymerase) 
(1 X final), de la Taq polymerase (1 unite) et d'eau (25 ul qsp). 

Le proced6 de preparation de sequences nucleotidiques susmentionne permet 
d'obtenir des sequences codantes partielles. 
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Une fois les sequences codantes partielles obtenues grace aux experiences 
precedentes, 1' amplification et le sequencage de la totalite de la sequence codante des 
ADNc de globines et du linker sont realises par 5' RACE (Rapid Amplification cDNA 
Ends) PCR et selon les recommandations protocolaires de la fiche technique fournie par 
le fournisseur (573' RACE kit, Roche). 

La presente invention conceme egalement un procede de preparation tel que 
defini ci-dessus, caracterise en ce que les couples d'amorces utilises sont tels que 
definis precedemment. 

Un procede de preparation particulierement avantageux selon l'invention est un 
procede de preparation de sequences nucleotidiques tel que defini ci-dessus, caracterise 
en ce que le couple d'amorces utilise est : (gar tgy ggn ccn ttr car cg cca ngc 

NTC YTT RTC RAA GCA) OU (GAR TGY GGN CCN TTR CAR CG ; CTC CTC TCC TCT 

cct ctt cct), R, Y et N etant tels que definis ci-dessus, 
ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 1'ADNc codant 
pour les chaines proteiques constituant la molecule d'hemoglobine d'Arenicola 
marina, de 4 minutes a une temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de l'ADNc codant pour une des chaines proteiques 
constituant la molecule d'hemoglobine d'Arenicola marina, de 30 secondes 
a une temperature egale a 95 °C, 

* une etape d'hybridation des couples d'amorces de l'invention aux brins 
d'ADNc monocatenaires susmentionnes pour obtenir des amorces 
hybridees, de 30 secondes a une temperature egale a 56°C, 

* une 6tape d'61ongation des amorces hybridees telles qu'obtenues 
prec6demment par une polymerase de 40 secondes a une temperature egale 
a 72°C, et 

- la derniere 6tape du procede est une etape d' elongation des amorces hybrid6es 
telles qu'obtenues precedemment par une polymerase de 10 minutes a une 
temperature egale a 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 13, 

ledit procede comprenant eventuellement une etape supplementaire de 5' RACE 
PCR pour obtenir la sequence nucleotidique SEQ ID NO : 1. 
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La sequence partielle SEQ ID NO : 13 a ensuite ete completee par des experiences 
5'RACE PCR comme explique ci-dessus. La sequence nucleotidique SEQ ID NO : 13 
est une nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a une chaine de globine, notee A2a. SEQ ID NO : 13 comprend 376 
nucleotides. 

La sequence nucleotidique SEQ ID NO : 1 (du codon initiateur au codon Stop, 
c'est a dire la sequence transcrite et traduite qui correspond a un monomere de globine 
fonctionnel) est une nouvelle sequence nucleotidique codant pour une chaine prot6ique 
correspondant a la chaine de globine susmentionnee, notee A2a. SEQ ED NO : 1 
comprend 474 nucleotides. 

Un procede de preparation particulierement avantageux selon l'invention est un 
procede de preparation de sequences nucleotidiques tel que defini ci-dessus, caracterise 
en ce que le couple d'amorces utilise est le suivant : (an tgy ggn ccn ctn car cg ; 
CCA ngc ntc ytt rtc RAA gca), N, Y et R 6tant tels que d6finis ci-dessus, 

ledit procedS etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de l'ADNc codant 
pour les chaines proteiques constituant la molecule d'hemoglobine d'ArenicoIa 
marina, de 4 minutes a une temperature egale a 95°C, 

- le cycle, repet6 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de l'ADNc codant pour une des chaines proteiques 
constituant la molecule d'hemoglobine d'ArenicoIa marina, de 30 secondes 
a une temperature egale a 95°C, 

* une etape d'hybridation des couples d'amorces de l'invention aux brins 
d'ADNc monocatenaires susmentionnes pour obtenir des amorces 
hybrid6es, de 30 secondes a une temperature egale a 52°C, 

* une etape d'elongation des amorces hybrid6es telles qu'obtenues 
precedemment par une polymerase de 40 secondes a une temperature egale 
a72°C,et 

- la derniere etape du procede est une etape d'61ongation des amorces hybridees 
telles qu'obtenues precedemment par une polymerase de 10 minutes a une 
temperature egale k 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 15. 
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La sequence nucleotidique SEQ ID NO: 15 est une nouvelle sequence 
nucleotidique codant pour une chaine proteique correspondant a une chaine de globine, 
notee A2b. SEQ ID NO : 15 comprend 288 nucleotides. 

Un precede de preparation particulierement avantageux selon l'invention est un 
procede de preparation de sequences nucleotidiques tel que defini ci-dessus, caracterise 
en ce que le couple d'amorces utilise est le suivant : (tgy ggn ath ctn car cg ; ctc 
CTC TCC TCT CCT CTT cct), N, Y et R etant tels que definis ci-dessus, 
ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 4 minutes a une 
temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes a une temperature egale a 95°C, 

* une etape d'hybridation de 30 secondes a une temperature egale a 53°C, 

* une etape d'Slongation de 40 secondes a une temperature egale a 72°C, et 

- la derniere 6tape du procede est une etape d'61ongation de 10 minutes a une 
temperature egale a 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 15, 

ledit procede comprenant eventuellement une etape supplemental de 5' RACE 
PCR pour obtenir la sequence nucleotidique SEQ ID NO : 3. 

La sequence partielle SEQ ED NO : 15 a ensuite ete completee par des experiences 
5 'RACE PCR comme explique ci-dessus. 

La sequence nucleotidique SEQ ID NO : 3 (du codon initiateur au codon Stop, 
c'est a dire la sequence transcrite et traduite qui correspond a un monomere de globine 
fonctionnel) est une nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a la chaine de globine susmentionnee, notee A2b. SEQ ID NO : 3 
comprend 477 nucleotides. 

Un procede de preparation particulierement avantageux selon Tinvention est un 
procede de preparation de sequences nucleotidiques tel que defini ci-dessus, caracterise 
en ce que le couple d'amorces utilise est : (aar gti aar can aac tgg ; cca ngc 

NCC DAT RTC RAA) OU (AAR GTI AAR CAN AAC TGG ; CTC CTC TCC TCT CCT CTT 

cct), R, I, N et D etant tels que definis ci-dessus, 
ledit procede etant caracterise en ce que : 
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- la premiere etape du precede est une etape de denaturation de l'ADNc codant 
pour chacune des chaines proteiques constituant la molecule d'hemoglobine 
d'Arenicola marina, de 4 minutes a une temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de l'ADNc codant pour une des chaines proteiques 
constituant la molecule d'hemoglobine d'Arenicola marina, de 1 minute a 
une temp6rature egale a 95°C, 

* une etape d'hybridation des couples d'amorces de l'invention aux brins 
d'ADNc monocatenaires susmentionnes pour obtenir des amorces 
hybridees, de 1 minute a une temperature egale a 50°C, 

* une etape d'elongation des amorces hybridees telles qu'obtenues 
precedemment par une polymerase de 1 minute et 30 secondes a une 
temperature egale a 72°C, et 

- la derniere etape du procede est une etape d'elongation des amorces hybridees 
telles qu'obtenues precedemment par une polymerase de 10 minutes a une 
temp6rature egale a 72°C, 

afin d' obtenir la sequence nucleotidique SEQ ID NO : 17, 

ledit procede comprenant eventuellement une etape supplemental de 5' RACE 
PCR pour obtenir la sequence nucleotidique SEQ ID NO : 5. 

La sequence partielle SEQ ID NO : 17 a ensuite ete completee par des experiences 
5 'RACE PCR comme explique ci-dessus. La sequence nucleotidique SEQ ID NO : 17 
est une nouvelle sequence nucleotidique codant pour une chaine prot6ique 
correspondant a urie chaine de globine, notee Al. SEQ ID NO: 17 comprend 360 
nucleotides. 

La sequence nucleotidique SEQ ID NO : 5 (du codon initiateur au codon Stop, 
c'est a dire la sequence transcrite et traduite qui correspond a un monomere de globine 
fonctionnel) est une nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a la chaine de globine susmentionnee, notee Al. SEQ ID NO : 5 
comprend 474 nucleotides. 

Un procede de preparation particulierement avantageux selon l'invention est. un 
procede de preparation de sequences nucleotidiques tel que defini ci-dessus, caracterise 
en ce que le couple d'amorces utilise est le suivant : (tgy tgy agy ath gar gay cg ; 
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CA NGC NYC RCT RTT RAA RCA) OU (TGY TGY AGY ATH GAR GAY CG ; CTC CTC TCC 

tct CCT ctt cct), Y, H, R et N etant tels que definis ci-dessus, 
ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de l'ADNc codant 
pour les chaines proteiques constituant la molecule d'hemoglobine d'Arenicola 
marina, de 4 minutes a une temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de l'ADNc codant pour une des chaines proteiques 
constituant la molecule d'hemoglobine d'Arenicola marina, de 30 secondes 
a une temperature egale a 95°C, 

* une etape d'hybridation des couples d'amorces de l'invention aux brins 
d'ADNc monocatenaires susmentionnes pour obtenir des amorces 
hybridees, de 40 secondes a une temperature egale a 52°C, 

* une etape d'elongation des amorces hybridees telles qu'obtenues 
precedemment par une polymerase de 30 secondes a une temperature egale 
a 72°C, et 

- la derniere etape du procede est une etape d'61ongationdes amorces hybridees 
telles qu'obtenues precedemment par une polymerase de 10 minutes a une 
temperature egale a 72°C, 

afin d' obtenir la sequence nucleotidique SEQ ID NO : 19, 

ledit procede comprenant eventuellement une etape supplementaire de 5' RACE 
PCR pour obtenir la sequence nucleotidique SEQ ID NO : 7. 

La sequence partielle SEQ ID NO : 19 a ensuite ete completee par des experiences 
5 'RACE PCR comme explique ci-dessus. La sequence nucleotidique SEQ ID NO : 19 
est une nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a une chaine de globine, notde B2. SEQ ID NO : 19 comprend 390 
nucleotides. 

La sequence nucleotidique SEQ ED NO : 7 (du codon initiateur au codon Stop, 
c'est a dire la sequence transcrite et traduite qui correspond a un monomere de globine 
fonctionnel) est une nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a la chaine de globine susmentionnee, notee B2. SEQ ID NO: 7 
comprend 498 nucleotides. 
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Un procede de preparation particulierement avantageux selon l'invention est un 
procede de preparation de sequences nucleotidiques tel que defini ci-dessus, caracterise 
en ce que le couple d'amorces utilise est le suivant : (aar gtn ath tty ggn agr ga ; 
ctc ctc tcc tct cct ctt cct), R, H, N et Y etant tels que defini s ci-dessus, 

ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 4 minutes a une 
temperature egale a 95 °C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes k une temperature egale a 95°C, 

* une etape d'hybridation de 40 secondes a une temperature egale a 52°C, 

* une etape d'elongation de 30 secondes a une temperature egale a 72°C, et 

- la derniere etape du procede est une etape d'elongation de 10 minutes a une 

temperature egale a 72°C, 

afin d'obtenir une sequence nucleotidique partielle de reference pour continuer la 
determination complete de cette sequence codante, 

ledit procede comprenant une etape supplemental de 5' RACE PCR pour 
obtenir la sequence nucleotidique SEQ ID NO : 9. 

La sequence nucleotidique SEQ ID NO : 9 (du codon initiateur au codon Stop, 
c'est a dire la sequence transcrite et traduite qui correspond a un monomere de globine 
fonctionnel) est une nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a une chaine de globine, not6e Bl. SEQ ID NO: 9 comprend 498 
nucleotides. 

Un procede de preparation particulierement avantageux selon l'invention est un 
procede de preparation de sequences nucleotidiques tel que defini ci-dessus, caracterise 
en ce que le couple d'amorces utilise est le suivant : (gar cay car tgy ggn ggn ga, 
ctc ctc tcc tct cct ctt cct), R, N et Y etant tel s que defini s ci-dessus, 

ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 4 minutes a une 
temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 40 secondes a une temperature egale a 95°C, 

* une etape d'hybridation de 1 minute a une temperature egale a 58°C, 
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* une etape d' elongation de 1 minute et 10 secondes a une temperature egale a 
72°C, et 

- la derniere etape du precede est une etape d'elongation de 10 minutes a une 
temperature egale a 72°C, 

afin d'obtenir une sequence nucleotidique partielle de reference pour continuer la 
determination complete de cette sequence codante, 

ledit precede comprenant une etape supplementaire de 5' RACE PCR pour 
obtenir la sequence nucleotidique SEQ ED NO : 1 1 . 

La sdquence nucleotidique SEQ ID NO : 11 (du codon initiateur au codon Stop, 
c'est a dire la sequence transcrite et traduite qui correspond a un monomere de globine 
fonctionnel) est une nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a une chaine de linker, notee LI. SEQ ID NO : 11 comprend 771 
nucleotides. 

La presente invention concerne egalement des sequences proteiques codees par 
l'une des sequences nucleotidiques telles qu'obtenues selon le precede tel que defini ci- 
dessus. 

Une proteine preferee selon l'invention est une proteine telle que ddfinie ci- 
dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence SEQ ID NO : 2 ou SEQ ED NO : 14, 

- ou toute sequence derivee de la sequence SEQ ED NO : 2 ou SEQ ID NO : 14 
ou d'un fragment defini ci-dessous, notamment par substitution, suppression ou addition 
d'un ou plusieurs acides amines, sous reserve que ladite sequence derivee permette le 
transport de I'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 2 ou SEQ ED 
NO : 14 ou d'un fragment defini ci-dessous, ayant de preference une homologie d'au 
moins environ 75%, notamment d'au moins environ 85%, avec la sequence SEQ ED 
NO : 2 ou SEQ DD NO : 14, sous reserve que ladite sequence homologue permette le 

transport de I'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de I'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ DD NO : 2. 

La sequence SEQ DD NO : 2 est une nouvelle sequence proteique correspondant a 
une chaine entiere de globine, notee A2a. 
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La sequence SEQ ID NO : 14 est une nouvelle sequence proteique correspondant 
a un fragment d'une sequence derivee de la chaine de globine, notee A2a, representee 
par la sequence SEQ ID NO : 2. 

Les proprietes de transport de l'oxygene des sequences proteiques de 1'invention 
peuvent etre notamment verifies en mesurant leur spectre d'absorption par 
spectrophotometrie typique de I'oxyhemoglobine. 

Une proteine preferee selon 1'invention est une proteine telle que definie ci- 
dessus, caract6ris6e en ce qu'elle comprend ou est constitute par : 

- la sequence SEQ ED NO : 4 ou SEQ ID NO : 16, 

- ou toute sequence derivee de la sequence SEQ ID NO : 4 ou SEQ ID NO : 16, 
ou d'un fragment defini ci-dessous, notamment par substitution, suppression ou addition 
d'un ou plusieurs acides amines, sous reserve sous reserve que ladite sequence derivee 
permette le transport de l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 4 ou SEQ ID 
NO : 16, ou d'un fragment defini ci-dessous, ayant de preference une homologie d'au 
moins environ 75%, notamment d'au moins environ 85%, avec la sequence SEQ ID 
NO : 4 ou SEQ ID NO : 16, sous reserve que ladite sequence homologue permette le 
transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 4. 

La sequence SEQ ID NO : 4 est une nouvelle sequence proteique correspondant a 
une chaine entiere de globine, notee A2b. 

La sequence SEQ ID NO : 16 est une nouvelle sequence proteique correspondant 
a un fragment d'une sequence derivee de la chaine de globine, notee A2b, representee 
par la sequence SEQ ID NO : 4. 

Une proteine preferee selon l'invention est une proteine telle que definie ci- 
dessus, caracterisee en ce qu'elle comprend ou est constitute par : 

- la sequence SEQ ID NO : 6 ou SEQ ID NO : 18, 

- ou toute sequence derivee de la sequence SEQ ID NO : 6 ou SEQ ID NO : 18 
ou d'un fragment defini ci-dessous, notamment par substitution, suppression ou addition 
d'un ou plusieurs acides amines, sous reserve sous reserve que ladite sequence derivee 
permette le transport de l'oxygene, 
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- ou toute sequence homologue de la sequence SEQ ID NO : 6 ou SEQ ID 
NO : 18 ou d'un fragment defini ci-dessous, ayant de preference une homologie d'au 
moins environ 75%, notamment d'au moins environ 85%, avec la sequence SEQ ID 
NO : 6 ou SEQ ID NO : 18, sous reserve que ladite sequence homologue permette le 

transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 6. 

La sequence SEQ ID NO : 6 est une nouvelle sequence proteique correspondant a 
une chaine entiere de globine, notee Al . 

La sequence SEQ ID NO : 18 est une nouvelle sequence proteique correspondant 
a un fragment d'une sequence derivee de la chaine de globine, notee Al , representee par 

la sequence SEQ ID NO : 6. 

Une proteine prefer6e selon l'invention est une proteine telle que d6finie ci- 
dessus, caractdrisee en ce qu'elle comprend ou est constitude par : 

- la sequence SEQ ID NO : 8 ou SEQ ID NO : 20, 

- ou toute sequence derivee de la sequence SEQ ID NO : 8 ou SEQ ID NO : 20 
ou d'un fragment defini ci-dessous, notamment par substitution, suppression ou addition 
d'un ou plusieurs acides amines, sous reserve que ladite sequence derivee permette le 

transport de l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 8 ou SEQ ID 
NO : 20 ou d'un fragment defini ci-dessous, ayant de preference une homologie d'au 
moins environ 75%, notamment d'au moins environ 85%, avec la sequence SEQ ID 
NO : 8 ou SEQ ID NO : 20, sous reserve que ladite sequence homologue permette le 

transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 8. 

La sequence SEQ ID NO : 8 est une nouvelle sequence proteique correspondant k 

une chaine entiere de globine, notee B2. 
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La sequence SEQ ID NO : 20 est une nouvelle sequence proteique correspondant 
a un fragment d'une sequence derivee de la chaine de globine, notee B2, representee par 
la sequence SEQ ID NO : 8. 

Une proteine preferee selon l'invention est une proteine telle que definie ci- 
dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence SEQ ID NO : 10, 

- ou toute sequence derivee de la sequence SEQ ID NO : 10 ou d f un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee permette le transport de 
Foxy gene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 10 ou d'un 
fragment defini ci-dessous, ayant de preference une homologie d'au moins environ 
75%, avec la sequence SEQ ID NO : 10, sous reserve que ladite sequence homologue 
permette le transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 10. 

La sequence SEQ ID NO : 10 est une nouvelle sequence proteique correspondant 
a une chaine de globine, notee B 1 . 

Une proteine preferee selon l'invention est une proteine telle que definie ci- 
dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence SEQ ID NO : 12, 

- ou toute sequence derivee de la sequence SEQ ID NO : 12 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee permette l'association des 
chaines de globines entre elles, 

- ou toute sequence homologue de la sequence SEQ ID NO : 12 ou d'un 
fragment defini ci-dessous, ayant de preference une homologie d'au moins environ 
75%, avec la sequence SEQ ED NO : 12, sous reserve que ladite sequence homologue 
permette l'association des chaines de globines entre elles, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette l'association des chaines de globines entre elles, notamment tout 



WO 2005/037392 PCT/FR2004/002602 

22 

fragment etant constitue d'au moins environ 60 acides amines, et notamment d'au 
moins environ 280 acides amines contigus dans la sequence SEQ ID NO : 12. 

La sequence SEQ ID NO : 12 est une nouvelle sequence proteique correspondant 
a une chaine de Linker, notee LI . 

La presente invention conceme egalement des sequences nucleotidiques telles 
qu'obtenues selon le precede tel que defini ci-dessus. 

La presente invention conceme egalement des sequences nucleotidiques codant 
pour une proteine telle que definie ci-dessus. 

La presente invention conceme egalement une sequence nucleotidique telle que 
definie ci-dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 1 ou SEQ ID NO : 13 codant 
respectivement pour SEQ ID NO : 2 ou SEQ ID NO : 14, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 1 ou SEQ ID NO : 13, et codant respectivement 
pour une proteine representee par SEQ ID NO : 2 ou SEQ ID NO : 14, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 1 
ou SEQ ID NO : 13 codant pour une proteine derivee respectivement de SEQ ID NO : 2 
ou SEQ ID NO : 14, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 1 ou SEQ ID 
NO : 13, ayant de preference une homologie d'au moins environ 60%, avec la sequence 
SEQ ID NO : 1, 

- ou tout fragment de la sequence nucleotidique SEQ ED NO : 1 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 

susmentionn6s, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

Les conditions de stringence correspondent a des gammes de temperatures 
comprises entre 48 et 60°C et de concentrations en MgCl 2 comprises entre 1 et 3 mM. 
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La presente invention conceme egalement une sequence nucleotidique telle que 
definie ci-dessus, caracterisee en ce qu'elle comprend ou est constitute par : 

- la sequence nucleotidique SEQ ID NO : 3 ou SEQ ID NO : 15 codant 
respectivement pour SEQ ED NO : 4 ou SEQ ID NO : 16, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 3 ou SEQ ID NO : 15, et codant respectivement 
pour une proteine representee par SEQ ID NO : 4 ou SEQ ID NO : 16, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 3 
ou SEQ ID NO : 15 codant respectivement pour une proteine derivee de SEQ ID NO : 4 
ou SEQ ID NO : 16, 

- ou toute sequence nucleotidique homologue de SEQ ED NO : 3 ou SEQ ID 
NO : 15, ayant de preference une homologie d'au moins environ 60%, avec la sequence 
SEQ ED NO : 3 ou SEQ ID NO : 15, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 3 ou SEQ ED 
NO : 15 ou des sequences nucleotidiques defmies ci-dessus, ledit fragment etant de 
preference constitue d'au moins environ 180 nucleotides, et notamment d'au moins 
environ 480 nucleotides contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

La presente invention conceme egalement une sequence nucleotidique telle que 
defmie ci-dessus, caracterisee en ce qu'elle comprend ou est constitute par : 

- la sequence nucleotidique SEQ ID NO : 5 ou SEQ ED NO : 17 codant 
respectivement pour SEQ ED NO : 6 ou SEQ ED NO : 18, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ED NO : 5 ou SEQ ID NO : 17, et codant respectivement 
pour une proteine representee par SEQ ID NO : 6 ou SEQ ID NO : 18, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 5 
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ou SEQ ID NO : 17 codant respectivement pour une proteine ddrivee de SEQ ID NO : 6 
ouSEQIDNO: 18, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 5 ou SEQ ID 
NO : 17, ayant de preference une homologie d'au moins environ 60%, avec la sequence 
SEQ ED NO : 5 ou SEQ ID NO : 17, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 5 ou SEQ ID 
NO : 17 ou des sequences nucleotidiques d6frnies ci-dessus, ledit fragment etant de 
preference constitue d'au moins environ 180 nucleotides, et notamment d'au moins 
environ 480 nucleotides contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

La presente invention conceme egalement une sequence nucleotidique telle que 
definie ci-dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 7 ou SEQ ID NO : 19 codant 
respectivement pour SEQ ID NO : 8 ou SEQ ID NO : 20, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 7 ou SEQ ID NO : 19, et codant respectivement 
pour une proteine representee par SEQ ID NO : 8 ou SEQ ID NO : 20, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 7 
ou SEQ ID NO : 19 codant respectivement pour une proteine derivee de SEQ ID NO : 8 
ou SEQ ID NO : 20, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 7 ou SEQ ID 
NO : 19, ayant de preference une homologie d'au moins environ 60%, avec la sequence 
SEQ ID NO : 7, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 7 ou SEQ ID 
NO : 19 ou des sequences nucleotidiques definies ci-dessus, ledit fragment etant de 
preference constitue d'au moins environ 180 nucleotides, et notamment d'au moins 
environ 480 nucleotides contigus dans ladite sequence, 
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- ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

La presente invention concerne egalement une sequence nucleotidique telle que 
definie ci-dessus, caracterisee en ce qu'elle comprend ou est constitute par : 

- la sequence nucleotidique SEQ ID NO : 9 codant pour SEQ ID NO : 10, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 9, et codant pour une proteine representee par 
SEQ ID NO : 10, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ED NO : 9 
codant pour une proteine derivee de SEQ ID NO : 10, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 9, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 9, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 9 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

La presente invention conceme egalement une sequence nucleotidique telle que 
definie ci-dessus, caracteris6e en ce qu'elle comprend ou est constitute par : 

- la sequence nucleotidique SEQ ID NO : 1 1 codant pour SEQ ID NO : 12, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 11, et codant pour une proteine representee par 
SEQ ID NO : 12, 
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- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 1 1 
codant pour une proteine derivee de SEQ ID NO : 12, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 11, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 1 1 , 

- ou tout fragment de la sequence nucleotidique SEQ ID NO: 11 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 800 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 

' susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

La presente invention concerne un precede de preparation tel que defini ci-dessus, 
de sequences nucleotidiques codant pour les chaines proteiques constituent la molecule 
d'hemoglobine d'Annelides, notamment d'Arenicola marina, ledit precede etant 
caracterise en ce qu'il comprend les etapes suivantes : 

- une etape de mise en presence de la molecule d'hemoglobine susmentionnee 
avec au moins un agent dissociant et un agent reducteur, notamment un melange 
constitue de dithiothreitol (DTT) ou de chlorhydrate de tris(2-carboxyethyl)phosphine 
(TCEP) ou de beta-mercaptoethanol et d'un tampon de dissociation, pendant un temps 
suffisant pour separer les chaines proteiques les unes des autres, 

permettant la dissociation, puis la reduction de ladite molecule d'hemoglobine, 
afin d'obtenir les chaines proteiques constituant ladite molecule, 

- l'isolement des chaines proteiques susmentionnees, 

- le microsequencage par spectrometrie de masse et le sequencage d'Edman de 
chacune des chaines proteiques isolees susmentionnees, afin d'obtenir une 
microsequence correspondant a chacune des sequences constituees de 5 a 20 acides 
amines, 

- la determination des couples d'amorces degenerees (sens et antisens) a partir 
des microsequences susmentionnees, 
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- la preparation des sequences nucleotidiques codant pour les chaines proteiques 
susmentionn6es, a partir des amorces telles qu'obtenues precedemment, par un precede 
d'amplification en chaine par polymerase (PCR), comprenant les etapes suivantes : 

- la premiere etape dudit precede est une etape de denaturation de l'ADNc 
codant pour les chaines proteiques constituant la motecule d'hemoglobine 
d'Arenicola marina, d'environ 10 secondes a environ 5 minutes a une temperature 
comprise d'environ 90°C a environ 110°C, 

- le cycle, repete environ 30 a 40 fois, comprend les etapes suivantes : 

* une etape de denaturation de l'ADNc codant pour les chaines proteiques 
constituant la molecule d'hemoglobine d'Arenicola marina, d'environ 10 
secondes a environ 5 minutes, a une temperature comprise d'environ 90°C a 
environ 110°C, 

* une etape d'hybridation des couples d'amorces de l'invention aux brins 
d'ADNc monocatenaires susmentionnds pour obtenir des amorces 
hybridees, d'environ 20 secondes a environ 2 minutes, a une temperature 
comprise d'environ 50°C a environ 56°C, 

* une etape d'elongation des amorces hybridees telles qu'obtenues 
precedemment par une polymerase d'environ 20 secondes a environ 1 
minute et 30 secondes, a une temperature comprise d'environ 70°C a 
environ 75°C, et 

- la derniere 6tape du precede est une etape d'elongation des amorces hybridees 
telles qu'obtenues precedemment par une polymerase d'environ 5 minutes a environ 
15 minutes a une temperature comprise d'environ 70°C a environ 75°C. 
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IWSCRTPTION PES FIGURES 

La Figure 1 represente un chromatogramme de l'hemoglobine de Arenicola 
marina sur colonne Superose 12-C. La courbe superieure correspond a une absorbance 
de 414 ran et la courbe inferieure a une absorbance de 280 nm. (Le collecteur est 
programme pour collecter entre 16 et 18 minutes). 

La Figure 2 represente le spectre UV de l'hemoglobine de Arenicola marina 
fonctionnelle (sous sa forme oxyhemoglobine). 

La Figure 3 represente le chromatogramme (a 414 nm) de 1'HbAm dissociee 
(partiellement) obtenu sur Superose 12-C et les traits verticaux sur le chromatogramme 
correspondent aux fenetres de collecte (correspondant a la recuperation des sous-unites). 

La Figure 4 represente un gel SDS-PAGE obtenu pour les differentes fractions 
collectees. 

La Figure 5 represente le chromatogramme (a 414 nm) de 1'HbAm dissociee 
(partiellement) obtenu sur CIM DISK DEAE (systeme d'echange anionique) et les traits 
verticaux sur le chromatogramme correspondent aux fenetres de collecte. La courbe en 
pointilles indique le gradient. 

La Figure 6 represente un gel SDS-PAGE obtenu pour les differentes fractions 
collectees. 

La Figure 7 represente la cinetique de dissociation de 1'HbAm en presence d'uree 
3M. L'axe des abscisses correspond au nombre de jours et l'axe des ordonnees 
correspond au pourcentage de dissociation de la molecule native ; la courbe en pointilles 
correspond au dodecamere ; la courbe avec les carres noirs au trimere et au "linker" 
(chaine de structure) ; la courbe avec les ronds noirs aux monomeres. 

La Figure 8 represente la cinetique de dissociation de 1'HbAm a pH 10. L'axe des 
abscisses correspond au nombre de jours et l'axe des ordonnees correspond au 
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pourcentage de dissociation de la molecule native ; la courbe en pointilles correspond au 
dodecamere ; la courbe avec les carres noirs au trimere et au "linker" ; la courbe avec 
les ronds noirs aux monomeres. 

La Figure 9 represente la cinetique de dissociation de 1'HbAm en presence d'uree 
3M a pH 10. L'axe des abscisses correspond au nombre de jours et l'axe des ordonnees 
correspond au pourcentage de dissociation de la molecule native ; la courbe en pointilles 
correspond au dodecamere ; la courbe avec les carres noirs au trimere et au "linker" ; la 
courbe avec les ronds noirs aux monomeres. 

La Figure 10 represente le suivi de la cinetique de reassociation a partir du 
pourcentage d'HbAm (HBL) et de Dodecamere (D) et selon la technique de 
changement de tampon (Centricon ou Dialyse). L'axe des abscisses correspond au 
nombre de jours et l'axe des ordonnees correspond au pourcentage de dissociation de la 
molecule native avec la technique Centricon ; la courbe en traits pointilles correspond a 
HBL avec la technique de dialyse ; la courbe avec les triangles noirs correspond au 
dodecamere avec la technique Centricon ; la courbe en trait plein correspond au 
dodecamere avec la technique de dialyse. 

La Figure 11 represente la superposition des chromatogrammes de 
chromatographic d' exclusion au cours de la reassociation correspondant a differents 
temps de reassociation. 

La Figure 12 represente le chromatogramme HPLC obtenu apres separation des 
chaines polypeptidiques par phase inverse sur une colonne Symmetry CI 8 (Waters). 
Les codes (d2, al, a2, b2, c) correspondent aux noms des globines telles que 
mentionnees dans l'article de Zal et al. (1997). 
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PARTTE EXPERIMENT ALE 

La presente invention a pour objectif l'utilisation de l'hemoglobine extracellulaire 
du polychaete marin Arenicola marina (HbAm) comme substitut sanguin chez des 
vertebres. Cependant, meme si ce ver represente une biomasse importante, la synthese 
par genie genetique s'avere une voie indispensable et necessaire. II est done primordial 
d'obtenir les sequences primaires des chaines proteique constituant HbAm arm de 
developper une hemoglobine artificielle, fonctionnelle et stable a partir des proprietes 
d'auto-assemblage de cette molecule. Les protocoles de dissociations de chaque sous- 
unite et de reduction en chaine polypeptidique, ainsi que les techniques de purification, 
d'isolement de micros6quencage et de sequencage de ces chaines et sont developpees en 
detail ci-apres. 

Extraction et purification de l'hemoglobine 

1) Rs pece etudiee : Arenicola marina ; Annelide de l'ecosysteme intertidal 
L'Annelide Polychete Arenicola marina est une espece sedentaire tres repandue 
sur toutes les cotes de V Atlantique Nord, de la mer Noire et de 1' Adriatique situees au- 
dessus du quarantieme parallele. Dans la region de Roscoff, l'Arenicole, communement 
appelee "ver du pecheur" constitue des populations denses. Le sediment habite par ces 
populations presente une surface irreguliere alternant bosses et creux formes 
respectivement par des monticules de dejections et des depressions coniques. 
L' Arenicole vit dans des galeries amenagees dans le sable. La structure de la galerie se 
presente sous forme de U, avec une branche ouverte sur l'exterieur, l'autre etant ferm6e. 
V Arenicole est logee dans la partie horizontale, son extremite cephalique orientee vers 
la partie aveugle. Elle ingere le sable, en extrait la matiere organique assimilable et 
defeque ensuite par son extremite caudale, formant ainsi des monticules de tortillons de 
sable. A l'interieur de l'etage mediolittoral, la repartition et la densite des peuplements 
sont essentiellement commandees par la granulometrie, la concentration en matiere 

organique et la salinite. 

L' Arenicole, vivant surtout dans les zones de balancement des marees, est amenee 
a subir des variations de pression d'oxygene. Sa galerie lui permet d'etre en contact 
permanent avec l'eau de mer (riche en oxygene), pendant la maree basse. 
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2) Methodes d'etude 

2.1. Prelevement du materiel biologique 

Les animaux sont recoltes a maree basse, dans la baie de Penpoull, pres de 
Roscoff (France) et maintenus dans l'eau de mer une nuit afm de vider leur tube 
digestif. Les prelevements de sang sont effectues a l'aide d'une seringue au niveau du 
vaisseau dorsal. Les echantillons sont collectes sur de la glace et filtres sur de la laine de 
verre. Apres une centrifugation a froid (15 000 g pendant 15 min a 4°C) pour eviter la 
dissociation des molecules et pour eliminer les debris tissulaires, les sumageants sont 
concentres au moyen d'une cellule Amicon (Millipore) et d'une membrane de "cut-off 
de 500 kDa (ne sont retenues que les masses superieures a 500 kDa). 

2.2. Purification des hemoglobines 

Une fois le sang concentre, une filtration basse pression (FPLC) par exclusion 
(separation en fonction de la taille de la molecule : plus la molecule est de taille 
importante plus elle est eluee rapidement) est effectuee sur colonne (100 x 3 cm) de gel 
Sephacryl S-400 (Amersham)(gamme de separation comprise entre 20 x 10 3 et 8000 x 
10 3 ), en chambre froide (4°C). Chaque purification est effectuee sur 5 mL d'echantillon, 
elues avec le tampon sale Arenicola marina (10 mM Hepes ; 4 mM KC1 ; 145 mM 
NaCl ; 0,2 mM MgCl 2 ajuste a pH 7,0 avec de la soude 2N). Le debit utilise pour cette 
premiere purification est de 40 tr/min et n'est recupere que la premiere fraction la plus 
rouge (contenant de l'heme). Cette fraction est ensuite concentree a l'aide de tube 
Centricon-lOkDa retenant les molecules d'un poids superieur ou egal a 10000 Da. 

Une deuxieme purification est ensuite effectuee par filtration basse pression 
(Systeme HPLC, Waters) d'aliquot de 200 uL sur une colonne 1 x 30 cm Superose 
12-C (Pharmacia, gamme de separation comprise entre 5 x 10 3 et 3 x 10 Da) a 
temperature ambiante. Le debit utilise est de 0,5 ml/min. Les echantillons sont 
conserves a 4°C et recoltes dans de la glace. L'absorbance de l'eluat est suivie a deux 
longueurs d'ondes : 280 ran (pic d'absorbance caracteristique des proteines) et 414 nm 
(pic d'absorbance caracteristique de l'heme). Les fractions contenant de l'heme sont 
isolees grace au collecteur (programme sur une fenetre de temps correspondant au 
temps de retention de rhemoglobine)(Figure 1). Les echantillons sont concentres, 
doses, puis stockes a -40°C avant utilisation. 
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2.3. Dosage des hemoglobines 

Le reactif de Drabkin (Sigma), utilise pour le dosage, permet de determiner la 
quantite en heme de la solution. L'hemoglobine reagit avec le reactif de Drabkin lequel 
contient du potassium de ferricyanure, du cyanure de potassium et du bicarbonate de 
sodium. L'hemoglobine est transformee en methemoglobine par Taction du 
ferricyanure. Les methemoglobines reagissent ensuite avec le cyanure pour former le 
cyanmethemoglobine. L'absorbance de ce derive a 540 nm est proportionnelle a la 
quantite d'heme dans la solution. Or, l'hemoglobine extracellulaire de Arenicola marina 
(HBL) contient en moyenne 1 mol d'heme pour 23 000 g de proteine, ce qui permet par 
un calcul simple, d'obtenir la concentration en HBL de chaque echantillon. 

3) Resultats 

Ainsi, plusieurs milligrammes d'hemoglobine extracellulaire de Arenicola marina 
ont ete purifies. Chaque lot (aliquots de lmL) est analyse par FPLC sur colonne 
Superose 12-C (Pharmacia) afin de s'assurer de la purete de l'echantillon (un pic 
unique). De meme un spectre UV sur une plage de 400 nm a 700 nm est realise pour 
verifier la fonctionnalite des h6moglobines de chaque lot (Figure 2). Trois maxima 
d'absorption sont observes a 414, 541 et 577 nm. Par comparison, on rappelle que la 
methemoglobine presente deux maxima a 500 et 635 nm. 

Enfin, ces lots sont utilises par la societe Biotrial S.A. (Rennes, France) pour des 
tests precliniques realises sur des souris et des rats afin de tester les eventuelles 
reactions pathologiques et immunogenes. 



nissnriation de 1'hemoPlobine ex tracellulaire de Arenicola manna en ces 
riiffSrentes sous-unites de bas* (Trimeres. Di mferes de linker et Monomeres) 

La dissociation de l'hemoglobine extracellulaire d' Arenicola marina (HbAm) doit 
etre totale et conserver les sous-unit6s fonctionnelles. Les differentes sous-unites sont 
ensuite isolees et analyses par des techniques de chromatographie liquide (exclusion et 
echange d'ions), developpees a cet effet. 



WO 2005/037392 



PCT7FR2004/002602 



33 



1) Dissociation de l'HBL 
1.1. Protocole de dissociation 

Les etudes preliminaires de dissociation ont ete developpees a partir des 
publications de Tart anterieur (Vinogradov et al., 1979 ; Sharma et al., 1996; 
Mainwaring et al., 1986 ; Polidori et al., 1984 ; Kapp et al., 1984 ; Chiancone et al., 
1972 ; Vinogradov et al., 1991 ; Krebs et al., 1996), c'est-a-dire en presence d'un reactif 
dissociant unique : uree, ions heteropolytungstate, sels de guanidinium, SDS ou ions 
hydroxydes. Les agents utilises agissent differemment sur la molecule : 

- les ions hydroxydes (OH"), le SDS, les sels de guanidinium et les ions 
heteropolytungstate destabilisent les ponts salins 

- l'uree destabilise les interactions hydrophobes 

Or, l'interet est d'obtenir le plus rapidement et le plus efficacement possible les 
quatre sous-unites de bases d'ou l'idee d'associer les differents agents dissociants et en 
particulier le pH alcalin et l'uree. Apres differents tests, il s'avere qu'une dissociation 
rapide et efficace est obtenue avec de l'uree 3M dilue dans le tampon de dissociation 
(0,1 M de base Trisma et ImM d'EDTA) ajuste a pH 10 avec de la soude 2N. L'HbAm 
est ajustee a une concentration d'environ 4 mg/mL (solution mere). Toutes les analyses 
sont effectudes a +4°C et les echantillons sont conserves a l'obscurite le temps de 
l'6tude. (Trisma = tris[hydroxymethyl]aminomethane) 

1 .2. Analyses par chromatographic d'exclusion 

Les conditions d'analyses sont detaillees dans le tableau 1 ci-dessous. 



Systfcme HPLC 


HPLC Waters 626 LC System 


Colonne 


Superose 12-C (Pharmacia) 
(pamme de separation comprise entre 5x10 s et 3x10 s Da) 


Debit 


0.5 mL/min 


Eluant 


tampon pH 7,0 
(tamponne par exemple avec de Vacide chlorhydrique concentre) 
et filtre sur filtre 0,22 urn (ou 0,45*1*0 


Temperature 
de Tinjecteur 


+ 4°C 




Echantillon 

Suivi Anaiytique Separation et coUecte 


Volume injecte 


f 20uL 


200uL 


Preparation 
des Echantillons 


Solution m^re dilute a 1 mg/mL 
dans le tampon de dissociation a 
pHIO et filtr^e sur 0,45um 


Solution m^re filtr£e sur filtre 0,45jim 
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1.3. Analyses par echange d' ions 

Le point isoelectrique (pHi) de l'HBL 6tant de 4,69 (Vinogradov, 1985), l'analyse 
par echange d'ions est realisee sur une colonne anionique CIM DEAE disk (Interchim). 
En effet, L'HBL est charg6e negativement pour un pH superieur au pHi et est done 
fixee sur une resine chargee positivement (resine DEAE). L'elution est effectuee grace a 
la force ionique avec un gradient non lineaire de NaCl de 0 a 1 M (solution de NaCl de 
1 M diluee dans le tampon de dissociation a pH 7,0 et filtree sur 0,45 urn). Le tampon 
de dissociation a pH 7 est utilise comme tampon d'elution. Le debit est de 4 mL/min. 



1.4. Analyses par chromatographie en phase inverse 

La chromatographie par phase inverse est effectuee sur une colonne de Symmetry 
300 C, 8 5um (4,6 * 250 mm) de chez Waters. En presence d'acetonitrile et de TFA 
(acide trifluoroacetique), HbAm se dissocie en ses sous unites de base (Trimere, 
Monomere et Linker) et l'heme se dissocie des globines. Ainsi, sans traitement 
prealable, HbAm est dissociee en tete de colonne. La methode developpee est decrite 
dans le tableau ci-dessous. 



debit 


1 mL/min 


Eluant A 


H 2 0 MilliO + 0.1% v/v RttfA 


EluantB 


ACN + 0.1% v/v HFBA 


Gradient 




Temps en 
min 


% A 


%B 




0 


58 


42 




40 


50 


50 




41 


48 


52 




90 


47 


53 




95 


5 


95 




110 


5 


95 



2) Resultats 

2.1. Chromatographie d'exclusion 

Le chromatogramme de 1'HbAm dissociee en partie, est represente figure 3. Cinq 
pics sont observes et il s'agit de les identifier. Les molecules sont 61uees selon leur 
masse decroissante et 1'HbAm native elue dans le volume mort (16 min). Les fractions 
corresponds a chaque pic sont analysees par SDS-PAGE (figure 4). Les resultats sont 
present6s dans le tableau 2 ci-dessous. 
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Fractions 


Temps de retention 


Sous-unites 


1 


16min40 


HbAm native 


- 2 


22 min 20 


Dodecamere 


3 


25 min 30 


Dimere de linker 


4 


26 min 40 


Trimere 


5 


28 min 30 


Monomeres 



2.2. Chromatographic ionique 

Une fois la methode developpee (tableau 3), les fractions sont collectees, 
concentres et analysees par gel SDS arm d'identifier chaque pic (Fig. 6 et tableau 4). 
Une methode est ensuite developpee pour repurifier chaque sous-unite. 



Temps 
en min 


A : 1M NaCl 
dans B 


B : Tampon de 
dissociation pH 7.0 


0 


5% 


95% 


0,5 


15% 


85% 


1,5 


15% 


85% 


2,5 


22% 


78% 


3,5 


22% 


78% 


3,6 


25% 


75% 


5,5 


25% 


75% 


5,6 


29% 


71% 


6,5 


29% 


71 % 


6,6 


36% 


64% 


7,0 


36% 


64% 


8,0 


45% 


r 55 % 


8,1 


100% 


0% 


9,5 


100% 


0% 



TABLEAU 3 : Methode developpee pour l'analyse de l'HBL dissocide sur CIM-DEAE 



fractions 


Temps de 
retention 


Sous-unites 


1 


1 min 15 


Monomeres 


2 


2 min 40 


Dimere de linker 


3 


3 min 10 


Dimere de linker 


4 


4 min 40 


Dodecamere 


5 


6 min 30 


? 


6 


7 min 30 


Trimere 


7 


8 min 50 


HbAm 



TABLEAU 4 : Association realisee apres 
analyse du gel (Figure 6) entre le temps de 
retention et les sous-unites. 
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2.3. Chromatographic en phase inverse 

Une fois la methode developpee, les fractions sont collectees, lyophilisees et 
analysees par spectrometrie de masse afin d'identifier chaque pic. 



fractions 


Temps de 
retention 


Sous-unites 


1 


12 min 


Linker 


2 


22min 


Linker 


3 


34 min 


Monomere al 


4 


38 min 


Monomere a2 


5 


50 -70 min 


Trimeres 



Les proprietes chimiques des trimeres doivent etre trop proches pour que l'on 
puisse les separer par phase inverse. Ainsi, seuls les deux linkers et les monomeres al et 
a2 ont pu etre isoles. 

2.4. Dissociation de THbAm 

La cinetique de dissociation est suivie par chromatographie d'exclusion. 
L'integration des chromatogrammes par le logiciel Millenium (Waters), permet le calcul 
du pourcentage des differents composes a partir de l'aire sous courbe. devolution de la 
cinetique de dissociation est representee figures 7, 8 et 9. 

Les trois graphiques des Figures 7, 8 et 9 montrent bien l'interet d'associer les 
deux agents dissociants (uree 3M et OH") pour obtenir efficacement les trois sous-unites 
de base en 24h. 



R6association de Phemoglobine 

1) Materiels et methodes 

Les experiences de reassociation sont effectuees sur 1'HbAm dissociee selon les 
protocoles cites plus haut (pH9, pHIO, Uree 3M, Uree 4M, Uree 3M a pHIO). 
Differents tampons de reassociation sont testes afin d'obtenir une reassociation 
optimale. Le changement de tampon (tampon de dissociation -» tampon de 
reassociation) est effectue de deux facons differentes : 

- L'HbAm dissociee est lavee 4 fois contre 4 mL de tampon de reassociation sur 
Centricon-10 (Millipore) a +4°C ; 
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- L'HbAm dissociee est dialysee 24 h contre de l'eau MilliQ (Millipore) (2 * 
2L) puis 48 h contre le tampon de reassociation (3 * 2L) a +4°C. 

2) Resultats 

D'apres des resultats ulterieurs sur les hemoglobines extracellulaires d'Annelides 
(Mainwaring et al., 1986 ; Polidori et al., 1984), la presence d'ions divalents tels que 
Ca 2+ et Mg 2+ est necessaire au maintien de la structure quatemaire de l'hemoglobine. En 
effet, ils la stabilisent et ralentissent le phenomene de dissociation (Sharma et al., 1996). 
Ces ions forment un complexe avec les groupes carboxylates des chaines laterales et 
carbonyles des chaines principales. La prdsence d'ions divalents peut avoir un effet sur 
la reassociation lorsque les groupements carboxyliques sont ionises, done entre autre 
lorsque la dissociation a eu lieu a pH alcalin. II est done important que le tampon de 
reassociation contienne du calcium et/ou du magnesium. Ceci explique aussi la presence 
d'EDTA dans le tampon de dissociation ; EDTA qui ch61ate ces ions divalents. Le 
tampon actuellement mis au point est constitue de 0,1 M de base Trisma, 400 mM de 
NaCl, 2,95 mM KC1, 32 mM MgS0 4 , 11 mM CaCl 2 ajuste a pH 7 avec de l'HCl 
concentre. La reassociation est suivie selon le meme principe que la dissociation 
(Figures 10 et 11). 

Une reassociation est observee si la dissociation est de courte duree de l'ordre de 
la minute. Cette reassociation correspond a un rearrangement d'intermediaires de 
dissociation qui sont des hemoglobines tronquees (HBL dissociee de 1 a plusieurs 
douziemes). 

Reduction de l'HbAm pour I'etude des diffK rentes chaines nolvDeDtidiaues 

1) Reduction de l'hemoglobine orealabl e a la separation par chromatographie 

liquide par phase inverse 

L'HbAm (4 mg/mL) est reduite dans 10% de DTT (dithiothreitol) dissous dans un 
tampon de dissociation a pH 8-9 (0,1 M trisma ou 10 mM bicarbonate d'ammonium) 
pendant 30 minutes a temperature ambiante. Une fois reduites, les chaines proteiques 
obtenues sont alkylees en presence de lOOmM iodoacetamide dissout dans un tampon 
de dissociation a pH 8-9 pendant 30 minutes a temperature ambiante. 

On peut eventuellement egalement envisager le protocole suivant : L'HbAm (4 
mg/mL) est reduite dans 100 mM de DTT (dithiothreitol) dissout dans le tampon de 
dissociation a pH 8-9 pendant 1 h a 40°C. Dans ces conditions drastiques, seules les 
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globines pourront etre analysees. En effet, les linkers (proteines non-globines) sont 
riches en. cysteines et sont done deteriores. Une fois reduite, 1'HbAm est lavee 4 fois sur 
Amicon 30 OOODa (Millipore) dont seul le filtrat est recupere (tout ce qui est de poids 
inferieur a 30 000 Da). Le filtrat est ensuite lave sur Amicon 10 OOODa pour eliminer 
tout ce qui est inferieur a 10 000 Da. Ainsi, seuls les monomeres compris entre 30 000 
Da et 10 000 Da sont contenus dans l'echantillon (gamme de poids des chaines de 
globines qui constituent 1'HbAm). 



2) Separation des chatnes proteiques par ch romatographic de phase inverse 
2.1. Materiels et methodes 

La chromatographic par phase inverse est effectuee sur une colonne de Symmetry 
300 Cig 5um (4,6 * 250 mm) de chez Waters. La methode developpee est decrite dans 
le tableau ci-dessous et le chromatogramme obtenu est represente figure 12. 



debit 


1 mL/min 


Eluant A 


H 2 0 MilliO + 0.1% v/v HFBA 


Eluant B 


ACN + 0.1%v/vHFBA 


Gradient 




Temps en 
min 


% A 


%B 




0 


75 


25 




2 


58 


42 




10 


58 


42 




40 


40 


60 




45 


0 


100 




55 


0 


100 



On peut eventuellement egalement envisager le protocole suivant. 



debit 


1 mL/min 


Eluant A 


H,0 MilliO + 0. 1% v/v TFA 


Eluant B 


ACN + 0.1%v/vTFA 


Gradient 


Temps en min 


%A 


%B 


0 


80 


20 


0,25 


60 


40 


4,0 


55 


45 


10,0 


55 


45 


10,05 


0 


100 


16,0 


0 


100 



Chaque chaine proteique (mises en evidence par un pic unique a 280nm) est 
collectee puis lyophilisee et stockee a -40°C jusqu'aux prochaines analyses. Ainsi, il a 
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ete possible de separer les 5 monomeres suivants : a, (-15952 kDa), a 2 (-15975 kDa), 
d 2 (-17033 kDa), b 2 (-16020 kDa) et c (-16664 kDa). 

3) Separation des chaines proteiques par eel bid imensionnel 

Le gel bidimensionnel qui est une combinaison des techniques 

d'isoelectrofocalisation en premiere dimension et de SDS-PAGE en seconde dimension 

permet de s6parer un melange complexe de proteine. 

Electrofocalisation 

Apres purification par FPLC, l'hemoglobine de Arenicola est dialysee et 
lyophilisee. 500 ug sont repris dans un tampon de rehydratation. Ce tampon contient du 
Chaps (3^(3-cholamidopropyl)dimethylammonio]-l-propane-sulfonate ; Sigma) a 4%, 
1% de DTT fraichement prepare, cocktail d'inhibiteurs de prot6ase (Bohringher), 50 
ug/ml de TLCK (inhibiteur de la trypsine), 1 ul de Bleu de Bromophenol a 1%. 

Le melange est sonique et centrifuge pour eliminer le materiel non dissous. On 
depose ensuite de l'huile de roche aux deux extremites du support de la bande 
d'electrofocalisation, et on depose ensuite l'echantillon au milieu. La bande de 17 cm 
est ensuite deposee sur l'echantillon en eliminant toute bulle d'air. La bande est alors 
recouverte d'huile de roche pour 6viter l'evaporation de l'echantillon. 

Une rehydratation active est alors realisee a 50V (20°C durant 12 heures). Ensuite 
nous procedons a la focalisation durant deux jours. 

La bande sera ensuite recuperee et placee sur un gel d'acrylamide 6-18%, 
notamment a 10%, de largeur 18 cm, de longueur 20 cm et d'epaisseur 1 mm. La 
migration est effectuee en enceinte refrigeree a 10°C, pendant 14 heures a 400 V, 25 
mA et 100 W. 

La separation des chaines proteiques sera alors realisee en fonction de leur taille 
apres avoir scell6 la bande en haut du gel a l'aide d'une solution d'agarose a 1%. Une 
fois separees, les bandes proteiques sont revelees sur gel par coloration au bleu de 
Coomassie (Coomassie® G250). 

Construction du gel en gradient 

Vingt-cinq ml de solution dense a 18% de polyacrylamide (acrylamide 2,5 M ; 
Tris 0,4 M ; Glycerol 30% (v/v) ; dodecyl sulfate de sodium (SDS) 3,5 mM ; TEMED 
(N.N.N'.N'-tetramethylethylenediamine ; Sigma) 0,05% (v/v) ; persulfate de sodium 
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1,6 mM) sont places dans la chambre de melange sous agitation constante tandis qu'un 
meme volume de solution legere a 6% de polyacrylamide (acrylamide 0,8 M ; Tris 0,4 
M ; SDS 3,5 mM ; TEMED 0,06% (v/v) ; persulfate de sodium 2,4 mM) est place dans 
l'autre chambre. Le haut du gel est recouvert d'une solution d'isobutanol saturee en eau 
bidistillee. Le gel est ensuite laisse 1 h a polymeriser a temperature ambiante puis le 
haut du gel est rince plusieurs fois avec de l'eau bidistillee et l'ensemble est place une 
nuit a 10°C. Apres avoir enleve l'eau residuelle a l'aide d'un papier absorbant, la 
solution de gel de concentration (acrylamide 0,56 M ; methylene bis-acrylamide 6,9 
mM ; Tris 124 mM ; SDS 3,5 mM ; TEMED 0,05% (v/v) ; persulfate de sodium 2,2 
mM) est coulee sur le gel de separation et une cale permettant de former l'empreinte de 
la bande est introduite dans la solution gel de concentration. La polymerisation est 
complete apres 1 h a temperature ambiante. 

4) Analyse par micro seauencage des cha tnes proteiques isolees par phase inverse 

et gel bidimensionnel 

Les chaines proteiques isolees par chromatographic en phase inverse et par gel 
bidimensionnel sont ensuite digerees et analysees par spectrometrie de masse LC- 
MS/MS sur un appareil de type ESI-Q-TOF. 

Digestion des proteines separees par chromatographie en phase inverse. 

Chaque chaine proteique isolee est soumise a une digestion enzymatique, etape 
essentielle avant leur analyse par microsequencage. Les chaines proteiques lyophilisees 
sont dissoutes dans une solution eau milliQ, acetonitrile contenant l'endoprotease ; la 
trypsine qui hydrolyse au niveau C-terminal de la lysine et de l'arginine, donnant 
generalement des peptides de masses comprises entre 500 et 2500 Da, pendant au 
minimum 3h a temperature ambiante. 

Digestion des proteines separees sur gel bidimensionnel 

Chaque spot du gel est decoupe pour etre soumis a une digestion enzymatique. 
Cette etape de digestion enzymatique est essentielle. Elle consiste a hydrolyser les 
proteines de facon specifique, a l'aide d'une enzyme, en plusieurs peptides. 

Avant de debuter la digestion, des etapes de decoloration, de reduction et 
d'alkylation sont indispensables : 
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• les lavages successifs a l'hydrogenocarbonate d'ammonium (NH4HCO3) et a 
l'acetonitrile (ACN) permettent d'eliminer 1'agent de coloration present dans le 
morceau de gel, 

• les reactions de reduction au dithiothreitol (DTT) et d'alkylation a 
l'iodoacetamide permettent l'ouverture puis le blocage des ponts disulfures formes entre 
deux cysteines presentes dans la sequence de la proteine et des liaisons cysteine- 
acrylamide. 

La derniere etape de la methode consiste a extraire du gel les peptides trypsiques a 
l'aide d'une solution d'extraction, composee d'acetonitrile et d'eau, additionnee d'un 
peu d'acide. 

Analyse par nanoLC-MS-MS 

Les peptides extraits sont ensuite transferes vers la plaque PCR. Ce transfert se 
fait en deux fois 15 uL, pour recuperer la totalis du volume. Pour eliminer 
l'acetonitrile, qui pourrait gener la retention des peptides sur la pre-colonne, un temps 
d'evaporation (pause) de 2 heures est applique avant l'analyse par nanoLC-MS-MS. 



Resultats 

Ceci a permis l'obtention de quelques centaines de micosequences correspondant 
a chaque chaine proteique separee par gel 2D. 

5) Analyse par seouencage d'Edman des chaf nes proteiaues isolees par 
chromatographie en phase inverse 



Principe 

En presence de tampon N-methyl piperidine, le Phenyl-Iso-Thio-Cyanate (PITC) 
se couple aux fonctions amines primaires et secondaires des proteines (PTC-Proteine). 
Le temps de reaction a 45°C est de 18 minutes. La liaison peptidique suivante est 
fragilisee, ce qui permet sa coupure en 3 minutes par l'acide trifluoracetique (TFA) pur 
generant ainsi l'anilino-thiazolinone (ATZ) du premier acide amine (AA) et la proteine 

ayant perdu le ler AA. 

L'ATZ-AA est extrait du milieu r6actionnel et converti en milieu acide (TFA a 25 
% dans l'eau) en phenyl thio-hydantouie (PTH-AA) plus stable. Le PTH-AA peut done 
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etre analyse par HPLC et sa nature determinee grace a un etalon de PTH-AAs. Le cycle 
de reaction peut etre repete et conduit ainsi a la sequence de la proteine. Edman a 
automatise la reaction qui porte son nom en creant en 1967 le premier sequenceur de 
prot6ine. L'appareil est couple a une HPLC dans laquelle il injecte le PTH-AA. Par 
comparaison avec un spectre etalon, il est alors possible d'identifier 1'acide amine 
d'origine et d'obtenir sa quantification. Le tout est sous le controle d'un ordinateur qui 
pilote les differents elements et assure l'acquisition de donnees ainsi que leur traitement. 

Resultats 

Ainsi, il a ete possible d'obtenir environ 30 acides amines des extremites N- 
terminales de 5 monomeres et d'un linker isoles par phase inverse. 



Details des protocoles d' amplification par PCR et presentatio n des sequences 
nucleotidiaues et polvpeptidiques des globines des sous-famili es Al. A2a. A2b, B2 
et Bl et du linker LI du polvchete marin Arenicola marina 

Les amplifications par PCR des 5 globines Al, A2a, A2b, Bl et B2, ainsi que du 
linker LI, dont les sequences nucleotidiques sont presentees ci-dessous, ont debute par 
la conception d'amorces degenerees specifiques (sens et antisens) des sous-families Al, 
A2, Bl et B2. Ces amorces, qui ont permis l'amplification des cinq globines 
susmentionnees (Al, A2a, A2b, Bl et B2) puis le clonage et le sequencage des produits 
de PCR correspondents, ont 6te concues a partir d'alignements de sequences proteiques 
de globines d'annelides disponibles dans les banques de donnees. 

Les matrices d'ADN complementaires utilisees pour les reactions de PCR ont ete 
synthetisees a partir d'ARN messagers purifies a partir d'ARN totaux extraits sur des 
Arenicoles, en raison de la petite taille des organismes et de leur rythme intense de 
croissance traduisant des niveaux importants d'expression des genes, dont ceux 
impliques dans la synthese de l'h6moglobine. Les ADN complementaires ont ainsi ete 
synth6tises. Ces etapes ont fait appel a des kits commerciaux de biologie moleculaire de 
chez Ambion (purification des ARNs), Amersham (purification des ARNm), Promega 
(RT), Invitrogene (clonage), Abgene (sequen9age). 
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Dans un second temps, nous avons mis au point les reactions de PCR, notamment 
en ce qui concerne la determination des parametres de temps de denaturation, de temps 
et de temperature d'hybridation et de temps d'elongation. Les concentrations en MgCl 2 
ont egalement ete optimisees. 

Enfin, dans une derniere etape, des experiences de 5' et 3' RACE PCR ont ete 
effectuees de facon a obtenir les s6quences codantes completes. Ces etapes ont fait 
appel au kit de biologie moleculaire de chez Roche. 

Sont presentees ci-dessous, les sequences nucleotidiques des amorces degenerees 
sens et antisens, les parametres des PCR et les sequences codantes partielles ou 
completes pour chacune des globines A2a, A2b, Al , Bl et B2, et pour le linker LI . 

On precise que l'analyse totale de ces sequences par un blast dans les banques de 
donnees donne des valeurs comprises entre 2.10" 3 < Evalue < 5 e 31 . 

Globine A2a 

Pour obtenir la s6quence nucleotidique SEQ ID NO : 1 codant pour la globine 

A2a (SEQ ID NO: 2), on utilise le couple d'amorces (SEQIDNO:19; 
SEQ ID NO : 20). 

Les conditions de PCR sont les suivantes : 

Temps et temperature initiale de denaturation : 4 min a 95°C 

Temps et Temperature de denaturation : 30 s & 95°C ~> 

Temps et Temperature d'hybridation: 30sa56°C > 35 cycles 

Temps et Temperature d'elongation : 40 s a 72°C J 

Temps et Temperature d'elongation finale : 1 0 min a 72°C 

Reaction de PCR : 

Par reaction : 5-20 ng ADNc 

100 ng amorce sens 

1 00 ng amorce antisens 

dNTP 200 uM final 

MgCh 2mM final 

Tampon PCR IX final 

1 unite Taq Polymerase 

Qsp25 uLH 2 Q 
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Globine A2b 

Pour obtenir la sequence nucleotidique SEQ ID NO : 3 codant pour la globine 
A2b (SEQ ID NO: 4), on utilise le couple d' amorces (SEQ ID NO: 21; 

SEQ ID NO :20). 

Les conditions de PCR sont les suivantes : 
PCR : 4 min a 95°C 

30 s a 95°C ~^ 

30 s a 52°C > 35 cycles 

40 s a 72°C J 

10mina72°C 

Globine Al 

Pour obtenir la sequence nucleotidique SEQ ID NO : 5 codant pour la globine A 
(SEQ ID NO : 6), on utilise le couple d'amorces (SEQ ID NO : 22 ; SEQ ID NO : 20). 
Les conditions de PCR sont les suivantes : 
PCR : 4 min a 95°C 

1 min a 95°C ^ 

1 min a 50°C > 35 cycles 

1 min 30 a 72°C J 

10mina72°C 



Globine B2 

Pour obtenir la sequence nucleotidique SEQ ID NO : 7 codant pour la globine B2 
(SEQ ID NO : 8), on utilise le couple d'amorces (SEQ ID NO : 23 ; SEQ ID NO : 20). 
Les conditions de PCR sont les suivantes : 
PCR : 4 min a 95°C 
30sa95°C 

40 s a 52°C )* 35 cycles 
30sa72°C 
10mina72°C 
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Globine Bl 

Pour obtenir la sequence nucleotidique SEQ ID NO : 9 codant pour la globine Bl 
(SEQ ID NO : 10), on utilise le couple d'amorces (SEQ ID NO : 24 ; SEQ ID NO : 20). 
Les conditions de PCR sont les suivantes : 
PCR: 4 min a 95°C 



Linker LI 

Pour obtenir la sequence nucl6otidique SEQ ID NO : 1 1 codant pour le Linker L1 
(SEQ ID NO : 12), on utilise le couple d'amorces (SEQ ID NO : 25 ; SEQ ID NO : 20). 
Les conditions de PCR sont les suivantes : 
PCR : 4mina95°C 



30 s a 95°C 
40 s a 52°C 
30 s a 72°C 




35 cycles 



10mina72°C 



40 s a 95°C 



lmin s a 58°C 



35 cycles 



lminsa72°C 



10mina72°C 
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REVENDICATIONS 



1. Precede d'obtention des chaines proteiques constituant la molecule 
d'hemoglobine extracellulaire d' Ann&ides, notamment d'Arenicola marina, 

ledit procede etant caracterise en ce qu'il comprend une etape de mise en presence 
d'un echantillon d'hemoglobine extracellulaire d'Annelides, notamment d'Arenicola 
marina avec au moins un agent dissociant, et le cas echeant un agent reducteur, 
notamment un melange constitue de ditbiothreitol (DTT) ou de chlorhydrate de tris(2- 
carboxyethyl)phosphine (TCEP) ou de beta-mercaptoethanol et d'un tampon de 
dissociation, pendant un temps suffisant pour separer les chaines proteiques les unes des 
autres. 

2. Procede selon la revendication 1, caracterise en ce que le tampon de 
dissociation comprend un agent tamponnant a une concentration comprise d'environ 
0,05 M a environ 0,1 M, notamment du Trisma (tris[hydroxymethyl]aminomethane) et 
OaiOmM d'EDTA ajuste a un pH compris d'environ 5 a environ 12, et de preference 
d'environ 7,5 a 12. 

3. Proc6de selon la revendication 1 ou 2, caracterise en ce que les chaines 
proteiques constituant ladite molecule sont obtenues par la reduction de quatre sous- 
unites par un agent reducteur, par exemple en presence de DTT, lesdites sous-unites 
etant elles-memes obtenues par mise en presence d'un echantillon d'hemoglobine 
extracellulaire d'Arenicola marina avec differents agents dissociants, notamment un 
tampon de dissociation. 

4. Procede de preparation de couples d'amorces a partir des chaines proteiques 
telles qu'obtenues selon le procede tel que defini dans l'une des revendications 1 a 3, 
ledit procede etant caracterise en ce qu'il comprend les etapes suivantes : 

- 1'isolement de chacune des chaines proteiques constituant la molecule 
d'hemoglobine telles qu'obtenues selon le procede tel que defini selon l'une des 
revendications 1 a 3, 

- le microsequencage par spectrometrie de masse et par sequencage d'Edman de 
chacune des chaines proteiques isolees susmentionnees, afm d'obtenir une 
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microsequence correspondant a chacune des sequences constitutes de 5 a 20 acides 
amines, et 

- la determination de couples d'amorces degenerees a partir des microsequences 
susmentionnees. 

5. Couples d'amorces tels qu'obtenus selon le procede de la revindication 4, 
lesdits couples etant notamment les suivants : 

a) Amorce sens : GAR TGY GGN CCN TTR CAR CG (SEQIDNO:21) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22) 

b) Amorce sens : TGY GGN ATH CTN CAR CG (SEQ ID NO : 23) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22) 

c) Amorce sens : AAR GTI AAR CAN AAC TGG (SEQ ID NO : 24) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO: 22) 

d) Amorce sens : TGY TGY AGY ATH GAR GAY CG (SEQ ID NO : 25) 
Amorce antisens: CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO: 22) 

e) Amorce sens: AAR GTN ATH TTY GGN AGR GA (SEQ ID NO: 26) 
Amorce antisens: CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO: 22) 

f) Amorce sens : GAR CAY CAR TGY GGN GGN GA (SEQ ID NO : 27) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22) 

ou: 

R represente A ou G, 
Y represente C ou T, 
N represente A, G, C ou T, 
I represente l'inosine, 
H represente A, C ou T 

6. Precede de preparation de sequences nucleotidiques codant pour les chaines 
proteiques constituant la molecule d'hemoglobine d'Arenicola marina, a partir des 
amorces telles qu'obtenues selon le procede de la revendication 4, ledit procede etant 
caracterise en ce qu'il correspond a un procede d'amplification en chaine par 
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polymerase (PCR), comprenant une repetition d'au moins 30 fois du cycle constitue par 
les etapes suivantes : 

* la denaturation, par chauffage, de l'ADNc monocatenaire codant pour une 
des chaines proteiques constituant la molecule d'hemoglobine d'Arenicola 
marina, de facon a denaturer d'eventuelles structures secondares et des reliquats 
d'ARN, ledit ADNc etant obtenu a partir d'ARNm, cette etape permettant 
d'obtenir des brins d' ADNc monocatenaires denatures, 

* l'hybridation des couples d'amorces tels qu'obtenus par le precede tel que 
defini ci-dessus aux brins d' ADNc monocatenaires denaturds susmentionnes a une 
temperature adequate, pour obtenir des amorces hybridees, et 

* la synthese du brin complementaire de l'ADNc par une polymerase a une 
temperature adequate, a partir des amorces hybridees telles qu'obtenues a l'etape 
precedente. 

7. Procede de preparation selon la revendication 6, caracterise en ce que : 

- la premiere etape dudit procede est une etape de denaturation d' environ 10 
secondes a environ 5 minutes a une temperature comprise d'environ 90°C a environ 
110°C, 

- le cycle, repete environ 30 a 40 fois, comprend les etapes suivantes : 

* une etape de denaturation d'environ 10 secondes a environ 5 minutes, a une 
temperature comprise d'environ 90°C a environ 1 10°C, 

* une etape d'hybridation d'environ 20 secondes a environ 2 minutes, a une 
temperature comprise d'environ 50°C a environ 60°C, et de preference 
d'environ 50°C a environ 56°C, 

* une etape d' elongation d'environ 20 secondes a environ 1 minute et 30 
secondes, a une temperature comprise d'environ 70°C a environ 75°C, et 

- la derniere etape du procede est une etape d'elongation d'environ 5 minutes a 
environ 15 minutes a une temperature comprise d'environ 70°C a environ 75°C. 



8. Procede de preparation selon la revendication 6 ou 7, caracterise en ce que 
les couples d'amorces utilises sont tels que definis dans la revendication 5. 



WO 2005/037392 PCT/FR2004/002602 

52 

9. Procede de preparation selon la revendication 8, caracterise en ce que le 
couple d' amorces utilise est le suivant : (gar tgy ggn ccn ttr car cg ; ctc ctc 
tcc tct cct ctt cct), R, Y et N etant tels que definis dans la revendication 5, 
ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 4 minutes a une 
temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes a une temperature egale a 95°C, 

* une etape d'hybridation de 30 secondes a une temperature egale a 56°C, 

* une etape d'elongation de 40 secondes a une temperature egale a 72°C, et 

- la derniere etape du procdde est une etape d'61ongation de 10 minutes a une 
temperature egale a 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 13, 

ledit procede comprenant eventuellement une etape supplemental de 5' RACE 
PCR pour obtenir la sequence nucleotidique SEQ ID NO : 1 . 

10. Proced6 de preparation selon la revendication 8, caracterise en ce que le 
couple d' amorces utilise est le suivant : (tgy ggn ath ctn car cg ; ctc ctc tcc 
tct cct ctt cct), N, Y et R etant tels que definis dans la revendication 5, 
ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 4 minutes a une 
temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes a une temperature egale k 95°C, 

* une etape d'hybridation de 30 secondes a une temperature egale a 53°C, 

* une etape d'elongation de 40 secondes a une temperature egale a 72°C, et 

- la derniere 6tape du procede est une etape d'61ongation de 10 minutes a une 
temperature egale a 72°C, 

afin d'obtenir la sequence nucldotidique SEQ ID NO : 15, 

ledit procede comprenant eventuellement une etape supplemental de 5' RACE 
PCR pour obtenir la sequence nucleotidique SEQ ID NO : 3. 
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11. Procede de preparation selon la revendication 8, caracterise en ce que le 
couple d'amorces utilise est le suivant : (aar gti aar can aac tgg ; ctc ctc tcc 
tct cct ctt cct), R, I et N etant tels que definis dans la revendication 5, 
ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 4 minutes a une 

temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 1 minute a une temperature egale a 95 °C, 

* une etape d'hybridation de 1 minute a une temperature egale a 50°C, 

* une etape d' elongation de 1 minute et 30 secondes a une temperature 6gale a 
72°C, et 

- la derniere etape du procede est une etape d'elongation de 10 minutes a une 
temperature egale a 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 17, 

ledit procede comprenant eventuellement une etape supplementaire de 5' RACE 
PCR pour obtenir la sequence nucleotidique SEQ ID NO : 5. 

12. Procede de preparation selon la revendication 8, caracterise en ce que le 
couple d'amorces utilise est le suivant : (tgy tgy agy ath gar gay cg ; ctc ctc 
tcc tct cct ctt cct), Y, H et R etant tels que definis dans la revendication 5, 
ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 4 minutes a une 

temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes a une temperature egale a 95°C, 

* une etape d'hybridation de 40 secondes a une temperature egale a 52°C, 

* une etape d'elongation de 30 secondes a une temperature egale a 72°C, et 

- la derniere etape du procede est une etape d'elongation de 10 minutes a une 
temperature 6gale a 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 19, 

ledit procede comprenant eventuellement une etape supplementaire de 5' RACE 
PCR pour obtenir la sequence nucleotidique SEQ ID NO : 7. 
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13. Procede de preparation selon la revendication 8, caracterisS en ce que le 
couple d'amorces utilise est le suivant : (aar gtn ath tty ggn agr ga ; ctc ctc 
tcc tct cct ctt cct), R, H, N et Y etant tels que definis dans la revendication 5, 

ledit proc6d6 6tant caracteris6 en ce que : 

- la premiere etape du proced<§ est une etape de denaturation de 4 minutes a une 
temp6rature 6gale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes k une temperature egale a 95°C, 

* une etape d'hybridation de 40 secondes a une temperature Sgale a 52°C, 

* une etape d'elongation de 30 secondes a une temperature egale a 72°C, et 

- la derniere 6tape du procede est une etape d'elongation de 10 minutes a une 
temperature egale a 72°C, 

afin d' obtenir une sequence nucleotidique partielle de reference, 
ledit procede comprenant une etape supplementaire de 5' RACE PCR pour 
obtenir la sequence nucleotidique SEQ ID NO : 9. 

14. Procede de preparation selon la revendication 8, caracterise en ce que le 
couple d'amorces utilise est le suivant : (gar cay car tgy ggn ggn ga, ctc ctc 
TCC TCT CCT CTT cct), R, N et Y etant tels que definis dans la revendication 5, 

ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 4 minutes a une 
temperature egale a 95°C, 

- le cycle, r6p6te 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 40 secondes a une temperature egale a 95°C, 

* une etape d'hybridation de 1 minute a une temperature egale a 58°C, 

* une 6tape d'elongation de 1 minute et 10 secondes k une temperature egale a 
72°C, et 

- la derntere 6tape du procede est une etape d'61ongation de 10 minutes a une 
temperature egale k 72°C, 

afin d' obtenir une sequence nucleotidique partielle de reference, 
ledit procede comprenant une etape supplementaire de 5' RACE PCR pour 
obtenir la sequence nucleotidique SEQ ID NO : 1 1. 
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15. Proteines codees par 1'une des sequences telles qu'obtenues selon le proc6de 
tel que defini dans Tune quelconque des revendications 6 a 14. 

16. Proteine selon la revendication 15, caracterisee en ce qu'elle comprend ou 
est constituee par : 

- la sequence SEQ ID NO : 2, 

- ou toute sequence derivee de la sequence SEQ ID NO : 2 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee permette le transport de 
l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 2 ou d'un fragment 
defini ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 
sequence SEQ ID NO : 2, sous reserve que ladite sequence homologue permette le 
transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides aminds, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 2. 

17. Proteine selon la revendication 15, caracterisee en ce qu'elle comprend ou 

est constituee par : 

- la sequence SEQ ID NO : 4, 

- ou toute sequence derivee de la sequence SEQ ID NO : 4 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amin6s, sous reserve sous reserve que ladite sequence derivee permette le 

transport de l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 4 ou d'un fragment 
defini ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 
sequence SEQ ID NO : 4, sous reserve que ladite sequence homologue permette le 

transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment 6tant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 4. 
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18. Proteine selon la revendication 15, caracterisee en ce qu'elle comprend ou 

est constitute par : 

- la sequence SEQ ID NO : 6, 

- ou toute sequence derivee de la sequence SEQ ID NO : 6 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve sous reserve que ladite sequence derivee permette le 
transport de l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 6 ou d'un fragment 
defini ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 
sequence SEQ ID NO : 6, sous reserve que ladite sequence homologue permette le 
transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 6. 

19. Proteine selon la revendication 15, caracterisee en ce qu'elle comprend ou 

est constitute par : 

- la sequence SEQ ID NO : 8, 

- ou toute sequence derivee de la sequence SEQ ID NO : 8 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee permette le transport de 
l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 8 ou d'un fragment 
defini ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 
sequence SEQ ID NO : 8, sous reserve que ladite sequence homologue permette le 

transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 8. 
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20. Proteine selon la revendication 15, caracterisee en ce qu'elle comprend ou 
est constitute par : 

- la sequence SEQ ID NO : 10, 

- ou toute sequence derivee de la sequence SEQ ID NO : 10 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee permette le transport de 
l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 10 ou d'un 
fragment defini ci-dessous, ayant de preference une homologie d'au moins environ 
75%, avec la sequence SEQ ID NO : 10, sous reserve que ladite sequence homologue 
permette le transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amin6s, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 10. 

21. Proteine selon la revendication 15, caracterisee en ce qu'elle comprend ou 
est constitute par : 

- la sequence SEQ ID NO : 12, 

- ou toute sequence derivee de la sequence SEQ ID NO : 12 ou d'un fragment 
d6fmi ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee permette l'association des 
chatnes de globines entre elles, 

- ou toute sequence homologue de la sequence SEQ ID NO : 12 ou d'un 
fragment defini ci-dessous, ayant de preference une homologie d'au moins environ 
75%, avec la sequence SEQ ID NO : 12, sous reserve que ladite sequence homologue 
permette l'association des chatnes de globines entre elles, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette l'association des chaines de globines entre elles, notamment tout 
fragment etant constitue d'au moins environ 60 acides amines, et notamment d'au 
moins environ 280 acides amines contigus dans la sequence SEQ ID NO : 12. 



22. Sequences nucleotidiques telles qu'obtenues selon le precede tel que defini 
dans l'une quelconque des revendications 6 a 14. 
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23. Sequences nucleotidiques codant pour une prottine telle que definie dans 
l'une des revendications 15 a 21. 

24. Sequence nucl6otidique selon la revendication 23, caracterisee en ce qu'elle 
comprend ou est constitute par : 

- la sequence nucleotidique SEQ ID NO : 1 codant pour SEQ ID NO : 2, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 1, et codant pour une proteine representee par 
SEQ ID NO : 2, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 1 
codant pour une proteine derivee de SEQ ID NO : 2, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 1, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 1, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 1 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sdquence nucleotidique complementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

25. Sequence nucleotidique selon la revendication 23, caracterisee en ce qu'elle 
comprend ou est constitute par : 

- la sequence nucleotidique SEQ ID NO : 3 codant pour SEQ ID NO : 4, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 3, et codant pour une proteine representte par 
SEQ ID NO : 4, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 3 
codant pour une proteine derivee de SEQ ID NO : 4, 



WO 2005/037392 PCT/FR2004/002602 

59 

- ou toute sequence nucleotidique homologue de SEQ ED NO : 3, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 3, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 3 ou des 
sequences nucleotidiques dSfinies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

26. Sequence nucleotidique selon la revendication 23, caracterisee en ce qu'elle 
comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 5 codant pour SEQ ID NO : 6, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
g6netique, de la sequence SEQ ID NO : 5, et codant pour une proteine representee par 
SEQ ID NO : 6, 

- ou toute sequence nucleotidique ddrivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 5 
codant pour une proteine d6riv£e de SEQ ID NO : 6, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 5, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 5, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 5 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 
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27. Sequence nucleotidique selon la revendication 23, caracterisee en ce qu'elle 
comprend ou est constitute par : 

- la sequence nucleotidique SEQ ID NO : 7 codant pour SEQ ID NO : 8, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 7, et codant pour une proteine representee par 
SEQ ID NO : 8, 

- ou toute sequence nucleotidique dSrivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 7 
codant pour une proteine derivee de SEQ ID NO : 8, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 7, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 7, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 7 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

28, Sequence nucleotidique selon la revendication 23, caracterisee en ce qu'elle 
comprend ou est constitute par : 

- la sequence nucleotidique SEQ ID NO : 9 codant pour SEQ ID NO : 10, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genttique, de la sequence SEQ ID NO : 9, et codant pour une proteine representee par 
SEQ ID NO: 10, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 9 
codant pour une proteine derivee de SEQ ID NO : 10, 

- ou toute sequence nucleotidique homologue de SEQ ED NO : 9, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 9, 
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- ou tout fragment de la sequence nucleotidique SEQ ID NO : 9 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique compiementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence compiementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

29. Sequence nucleotidique selon la revendication 23, caracteris6e. en ce qu'elle 
comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 1 1 codant pour SEQ ID NO : 12, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 1 1, et codant pour une proteine representee par 
SEQ ID NO : 12, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 11 
codant pour une proteine derivee de SEQ ID NO : 12, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 11, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 1 1, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO: 11 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 800 nucleotides 

contigus dans ladite sequence, 

- ou toute sequence nucleotidique compldmentaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence compiementaire d'une des sequences ou d'un des 
fragments susmentionnes. 



30. Proced6 de preparation selon la revendication 6, de sequences 
nucleotidiques codant pour les chaines proteiques constituant la molecule 
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d'hemoglobine d'Annelides, notamment d'Arenicola marina, ledit procede etant 
caracterise en ce qu'il comprend les etapes suivantes : 

- une etape de raise en presence de la molecule d'hemoglobine susmentionnee 
avec au moins un agent dissociant et im agent reducteur, notamment un melange 
constitue de dithiothreitol (DTT) ou de chlorhydrate de tris(2-carboxyethyl)phosphine 
(TCEP) ou de beta-mercaptoethanol et d'un tampon de dissociation, pendant un temps 
suffisant pour separer les chaines proteiques les unes des autres, 

permettant la dissociation, puis la reduction, de ladite molecule d'hemoglobine, 
afin d'obtenir les chaines proteiques constituant ladite molecule, 

- l'isolement de chacune des chaines proteiques susmentionnees, 

- le microsequencage par spectrometrie de masse et le sequencage d'Edman de 
chacune des chaines proteiques isolees susmentionnees, afin d'obtenir une 
microsequence correspondant a chacune des sequences constitutes de 5 a 20 acides 
amines, 

- la d6termination des couples d'amorces degenerees a partir des microsequences 
susmentionnees, 

- la preparation des sequences nucleotidiques codant pour les chaines proteiques 
susmentionnees, a partir des amorces telles qu'obtenues precedemment, par un procede 
d'amplification en chaine par polymerase (PCR), comprenant les etapes suivantes : 

- la premiere etape dudit procede est une etape de denaturation d'environ 10 
secondes a environ 5 minutes a une temperature comprise d'environ 90°C a environ 
110°C, 

- le cycle, repet6 environ 30 a 40 fois, comprend les etapes suivantes : 

* une 6tape de denaturation d'environ 10 secondes k environ 5 minutes, a une 
temperature comprise d'environ 90°C a environ 1 10°C, 

* une etape d'hybridation d'environ 20 secondes a environ 2 minutes, a une 
temperature comprise d'environ 50°C a environ 56°C, 

* une etape d' elongation d'environ 20 secondes a environ 1 minute et 30 
secondes, a une temperature comprise d'environ 70°C a environ 75°C, et 

- la derniere etape du procede est une etape d'61oi£ation d'environ 5 minutes a 
environ 15 minutes a une temperature comprise d'environ 70°C a environ 75°C. 
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LISTE DE SEQUENCES 

<110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE 

<120> PROCfiDfi DE DISSOCIATION DE LA MOLECULE D 1 HfiMOGLOBINE 

EXTRACELLULAIRE D 1 ARENICOLA MARINA, CARACTERI SATION DES CHAlNES 
PROTfelQUES CONSTITUANT LADITE MOLECULE ET DES SEQUENCES 
NUCLfeOTIDIQUES CODANT POUR LESDITES CHAlNES PROTfilQUES 

<130> WOB CNR GLOB 



<150> 
<151> 



FR 03/11992 
2003-10-14 



<160> 31 

<170> Patentln version 3.1 

<210> 1 

<211> 474 

<212> ADN 

<213> Arenicola marina 



<220> 
<221> 
<222> 
<223> 



CDS 
(1) • 



(474) 



<400> 1 

atg aag tec ttg gtg gtt ctg ttc gec ctg gtg gec atg gtg get gca 
Met Lys Ser Leu Val Val Leu Phe Ala Leu Val Ala Met Val Ala Ala 
15 10 15 

gag tgc ggc ccc atg cag cgc etc ctg gtc aag acc cag tgg aac aag 
Glu Cys Gly Pro Met Gin Arg Leu Leu Val Lys Thr Gin Trp Asn Lys 
20 25 30 

gtg tac ggc acc age aag gtc agg gac gag gec gga cac gtc etc tgg 
Val Tyr Gly Thr Ser Lys Val Arg Asp Glu Ala Gly His Val Leu Trp 
35 40 45 

aag get att ttc gee cag gat ccc gag acc egg get etc ttc aag aga 
Lys Ala lie Phe Ala Gin Asp Pro Glu Thr Arg Ala Leu Phe Lys Arg 
50 55 60 

gtc aac ggt gac gac ate tac tct ccc gag ttc atg get cac age gec 
Val Asn Gly Asp Asp He Tyr Ser Pro Glu Phe Met Ala His Ser Ala 
65 ^ 70 75 80 

cgt gtc ttg ggt ggc ctt gac att gee ate tec etc etc gac aac cag 
Arg Val Leu Gly Gly Leu Asp He Ala He Ser Leu Leu Asp Asn Gin 
85 90 95 

get gac ctt gac gtc gee ctg get cac ctt cac gtg cag cac gta gaa 
Ala Asp Leu Asp Val Ala Leu Ala His Leu His Val Gin His Val Glu 
100 105 HO 

agg cac ate cca acc cgc tac ttc gat ctg ttc aag aac gee ctg atg 
Arg His He Pro Thr Arg Tyr Phe Asp Leu Phe Lys Asn Ala Leu Met 
115 120 125 



48 



96 



144 



192 



240 



288 



336 



384 
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gag tat gcc ccc age gec ctg gga cgc tgc ttc gat aag acc gec tgg 
Glu Tyr Ala Pro Ser Ala Leu Gly Arg Cys Phe Asp Lys Thr Ala Trp 
130 135 140 

age teg tgc ttt gac gtc ate gcc aac ggc ate aag gaa tag 
Ser Ser Cys Phe Asp Val lie Ala Asn Gly lie Lys Glu 
145 150 155 



<210> 2 
<211> 157 
<212> PRT 

<213> Arenicola marina 
<400> 2 

Met Lys Ser Leu Val Val Leu Phe Ala Leu Val Ala Met Val Ala Ala 
15 10 15 

Glu Cys Gly Pro Met Gin Arg Leu Leu Val Lys Thr Gin Trp Asn Lys 
20 25 30 

Val Tyr Gly Thr Ser Lys Val Arg Asp Glu Ala Gly His Val Leu Trp 
35 40 45 

Lys Ala lie Phe Ala Gin Asp Pro Glu Thr Arg Ala Leu Phe Lys Arg 
50 55 60 

Val Asn Gly Asp Asp lie Tyr Ser Pro Glu Phe Met Ala His Ser Ala 
65 ' 70 75 80 

Arg Val Leu Gly Gly Leu Asp lie Ala lie Ser Leu Leu Asp Asn Gin 
85 90 95 

Ala Asp Leu Asp Val Ala Leu Ala His Leu His Val Gin His Val Glu 
100 105 HO 

Arg His lie Pro Thr Arg Tyr Phe Asp Leu Phe Lys Asn Ala Leu Met 
115 120 125 

Glu Tyr Ala Pro Ser Ala Leu Gly Arg Cys Phe Asp Lys Thr Ala Trp 
130 135 140 

Ser Ser Cys Phe Asp Val lie Ala Asn Gly lie Lys Glu 

155 



145 


150 


<210> 


3 


<211> 


477 


<212> 


ADN 


<213> 


Arenicola marina 


<220> 




<221> 


CDS 


<222> 


(1) . . (477) 


<223> 




<400> 


3 


atg aag ttc ttg gtg gtt 



432 



474 



48 



10 15 



WO 2005/037392 



3/19 



PCT7FR2004/002602 



144 



192 



240 



288 



336 



384 



gat tgt ggc ccc atg cag cgc etc ctg gtc aag gec cag tgg aac aag 96 
Asp Cys Gly Pro Met Gin Arg Leu Leu Val Lys Ala Gin Trp Asn Lys 
20 2 5 30 

gtg tac ggc acc age aag gtc agg gac gac gec gga cac gtc etc tgg 
Val Tyr Gly Thr Ser Lys Val Arg Asp Asp Ala Gly His Val Leu Trp 
35 40 45 

aag get ate ttc aac cag gat ggt gag acc cgc gee etc ttc aac aga 
Lys Ala lie Phe Asn Gin Asp Gly Glu Thr Arg Ala Leu Phe Asn Arg 
50 55 60 

gtg cac ggt gac gac ate tac tct ccc gag ttc atg get cac age gee 
Val His Gly Asp Asp He Tyr Ser Pro Glu Phe Met Ala His Ser Ala 
65 70 75 80 

cgt gtc ttg ggt ggc ctt gac att gec ate tec etc etc gac aac cag 
Arg Val Leu Gly Gly Leu Asp He Ala He Ser Leu Leu Asp Asn Gin 
85 90 95 

get gag ctt gac get gtc ctg get cac etc aag gag cag cac att gag 
Ala Glu Leu Asp Ala Val Leu Ala His Leu Lys Glu Gin His He Glu 
100 105 HO 

agg ggg ate cca gac cgt tac ttc gac ctg ttc aag aac gee ctg atg 
Arg Gly He Pro Asp Arg Tyr Phe Asp Leu Phe Lys Asn .Ala Leu Met 
115 120 125 

gag ttt gec ccc age gec ttg gga cgc tgc ttc ata aag gac get tgg 432 
Glu Phe Ala Pro Ser Ala Leu Gly Arg Cys Phe He Lys Asp Ala Trp 
130 135 140 

age tea tgc ttt gac gtc att gee aac ggc ate aag gga cag taa 477 
Ser Ser Cys Phe Asp Val He Ala Asn Gly He Lys Gly Gin 
145 150 155 



<210> 4 

<211> 158 

<212> PRT 

<213> Arenicola marina 

<400> 4 

Met Lys Phe Leu Val Val Leu Phe Ala Leu Val Ala Met Val Ala Ala 
1 5 10 15 

Asp Cys Gly Pro Met Gin Arg Leu Leu Val Lys Ala Gin Trp Asn Lys 
20 25 30 

Val Tyr Gly Thr Ser Lys Val Arg Asp Asp Ala Gly His Val Leu Trp 
35 40 45 

Lys Ala He Phe Asn Gin Asp Gly Glu Thr Arg Ala Leu Phe Asn Arg 
50 55 60 

Val His Gly Asp Asp He Tyr Ser Pro Glu Phe Met Ala His Ser Ala 
65 ' 70 75 80 

Arg Val Leu Gly Gly Leu Asp He Ala He Ser Leu Leu Asp Asn Gin 
85 90 95 
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Ala Glu Leu Asp Ala Val Leu Ala His Leu Lys Glu Gin His lie Glu 
100 105 110 

Arg Gly lie Pro Asp Arg Tyr Phe Asp Leu Phe Lys Asn Ala Leu Met 
115 120 125 

Glu Phe Ala Pro Ser Ala Leu Gly Arg Cys Phe He Lys Asp Ala Trp 
130 135 140 

Ser Ser Cys Phe Asp Val He Ala Asn Gly He Lys Gly Gin 
145 150 155 



<210> 


5 


<211> 


474 


<212> 


ADN 


<213> 


Arenicola marina 


<220> 




<221> 


CDS 


<222> 


(1) . • (474) 


<223> 




<400> 


5 


atg aag gtc ctg ate gta 


Met Lys Val Leu He Val 


1 


5 



g atg gec tgc ttg gec tac gtc gec gec 48 

u Met Ala Cys Leu Ala Tyr Val Ala Ala 
10 15 

gac tgc gga cct ctg cag agg ctg aag gtg aag cat cag tgg gtg cag 96 

Asp Cys Gly Pro Leu Gin Arg Leu Lys Val Lys His Gin Trp Val Gin 

20 25 30 

gtg tac age ggc cat ggt tac gag cgt gag gcg ttc ggc aga gag gtc 144 

Val Tyr Ser Gly His Gly Tyr Glu Arg Glu Ala Phe Gly Arg Glu Val 

35 40 45 

ttc etc gag atg tac aac cag gca ccc aag gee aag gac etc ttc ace 192 

Phe Leu Glu Met Tyr Asn Gin Ala Pro Lys Ala Lys Asp Leu Phe Thr 
50 " 55 60 

agg gtc agg ggc gag aac gtc ttc tec ccc gag ttc gga gec cac atg 240 

Arg Val Arg Gly Glu Asn Val Phe Ser Pro Glu Phe Gly Ala His Met 

65 ' 70 75 80 



gtc cgt gtg etc gga gga etc gac atg tgc ate get ctg ctg tec gat 
Val Arg Val Leu Gly Gly Leu Asp Met Cys He Ala Leu Leu Ser Asp 
85 90 95 

gac acc gtc etc aac gee cag ctt get cac etc age acg cag cac aag 
Asp Thr Val Leu Asn Ala Gin Leu Ala His Leu Ser Thr Gin His Lys 
100 105 HO 

gac cgt gga ate ccc aac gag tac ttc gat gtg atg aag gtc gee etc 
Asp Arg Gly He Pro Asn Glu Tyr Phe Asp Val Met Lys Val Ala Leu 
115 120 125 

atg aag gtc gtc ccc ggc cac gtt tea cac ttc gac ttc gat gee tgg 
Met Lys Val Val Pro Gly His Val Ser His Phe Asp Phe Asp Ala Trp 
130 135 140 



288 



336 



384 



432 
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tct gcc tgc tat gac gtc ate gec aac ggc ate aag cac taa 
Ser Ala Cys Tyr Asp Val lie Ala Asn Gly lie Lys His 
145 150 155 



<210> 6 

<211> 157 

<212> PRT 

<213> Arenicola marina 



<400> 6 

Met Lys Val Leu He Val Leu Met Ala Cys Leu Ala Tyr Val Ala Ala 
I 5 10 15 

Asp Cys Gly Pro Leu Gin Arg Leu Lys Val Lys His Gin Trp Val Gin 
20 25 30 

Val Tyr Ser Gly His Gly Tyr Glu Arg Glu Ala Phe Gly Arg Glu Val 
35 40 45 

Phe Leu Glu Met Tyr Asn Gin Ala Pro Lys Ala Lys Asp Leu Phe Thr 
50 55 60 

Arc Val Arg Gly Glu Asn Val Phe Ser Pro Glu Phe Gly Ala His Met 
65 70 75 80 

Val Arg Val Leu Gly Gly Leu Asp Met Cys He Ala Leu Leu Ser Asp 
85 ' 90 95 

Asp Thr Val Leu Asn Ala Gin Leu Ala His Leu Ser Thr Gin His Lys 
100 105 HO 

Asp Arg Gly He Pro Asn Glu Tyr Phe Asp Val Met Lys Val Ala Leu 
115 120 125 

Met Lys Val Val Pro Gly His Val Ser His Phe Asp Phe Asp Ala Trp 
130 135 140 

Ser Ala Cys Tyr Asp Val He Ala Asn Gly He Lys His 
145 150 155 



<210> 7 
<211> 498 
<212> ADN 

<213> Arenicola marina 
<220> 

<221> CDS 

<222> (1) . . (498) 

<223> 

<400> 7 k 
atg ctt cgt ttc gta gca etc ttg get ctg gtc ggc ctg gcc gtc tgt 
Met Leu Arg Phe Val Ala Leu Leu Ala Leu Val Gly Leu Ala Val Cys 
15 io 15 

qac gac tgt tgt acc acc gag gac cgc aag gag gtc cag acg ctg tgg 
Asp Asp Cys Cys Thr Thr Glu Asp Arg Lys Glu Val Gin Thr Leu Trp 
20 25 30 
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agt gag ate tgg agt gec cag ttc act ggt cgc cgt gtc cag gtt gec 144 
Ser Glu He Trp Ser Ala Gin Phe Thr Gly Arg Arg Val Gin Val Ala 
35 40 45 

cag get gtg ttc gag gac etc ttc cgc cgc gac ccc gag tec aag aac 192 
Gin Ala Val Phe Glu Asp Leu Phe Arg Arg Asp Pro Glu Ser Lys Asn 
50 55 60 

ctg ttc aag cgc gtc aat gtt gac gac atg aac age ccc gaa ttc cac 240 
Leu Phe Lys Arg Val Asn Val Asp Asp Met Asn Ser Pro Glu Phe His 
65 70 75 80 



get cac tgc ate cgt gtt gtc aac ggt ctt gac ace gtg ate ggt etc 288 
Ala His Cys He Arg Val Val Asn Gly Leu Asp Thr Val He Gly Leu 
85 90 95 



ctt gac gac ccc gac ace ctg aag tec cag etc gag cac ttg gee cag 336 
Leu Asp Asp Pro Asp Thr Leu Lys Ser Gin Leu Glu His Leu Ala Gin 
100 105 HO 



cag cac aag gag cgt gat ggc ate cac aag ace cac ttc gac gag atg 
Gin His Lys Glu Arg Asp Gly He His Lys Thr His Phe Asp Glu Met 
115 120 125 

tec cac gee ttc ggc gee gtc atg ccc cag gtc age age tgc ttc aac 
Ser His Ala Phe Gly Ala Val Met Pro Gin Val Ser Ser Cys Phe Asn 
130 135 140 

ccc gat gee tgg aac cgt tgc ttc ggc tec ate get ace aag att get 
Pro Asp Ala Trp Asn Arg Cys Phe Gly Ser lie Ala Thr Lys He Ala 
145 150 155 160 

tec etc etc gag gat taa 
Ser Leu Leu Glu Asp 
165 



384 



432 



480 



498 



<210> 8 
<211> 165 
<212> PRT 

<213> Arenicola marina 
<400> 8 

Met Leu Arg Phe Val Ala Leu Leu Ala Leu Val Gly Leu Ala Val Cys 
15 10 15 

Asp Asp Cys Cys Thr Thr Glu Asp Arg Lys Glu Val Gin Thr Leu Trp 
20 25 30 

Ser Glu He Trp Ser Ala Gin Phe Thr Gly Arg Arg Val Gin Val Ala 
35 40 45 

Gin Ala Val Phe Glu Asp Leu Phe Arg Arg Asp Pro Glu Ser Lys Asn 
50 55 60 

Leu Phe Lys Arg Val Asn Val Asp Asp Met Asn Ser Pro Glu Phe His 
65 70 75 80 

Ala His Cys He Arg Val Val Asn Gly Leu Asp Thr Val He Gly Leu 
85 90 95 
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Leu Asp Asp Pro Asp Thr Leu Lys Ser Gin Leu Glu His Leu Ala Gin 
100 105 HO 

Gin His Lys Glu Arg Asp Gly He His Lys Thr His Phe Asp Glu Met 
115 " 120 125 

Ser His Ala Phe Gly Ala Val Met Pro Gin Val Ser Ser Cys Phe Asn 
130 135 140 

Pro Asp Ala Trp Asn Arg Cys Phe Gly Ser He Ala Thr Lys He Ala 
145 150 155 160 

Ser Leu Leu Glu Asp 
165 



<210> 9 
<211> 498 
<212> ADN 

<213> Arenicola marina 
<220> 

<221> CDS 

<222> (1) . . (498) 

<223> 

<400> 9 .„ 
atg atg tec gtc gtg ttc etc etc ggc ctt gtg gee tac gee tec gee 4b 
Met Met Ser Val Val Phe Leu Leu Gly Leu Val Ala Tyr Ala Ser Ala 
1 5 10 I 5 

tec age tgc tgc tec tat gga gac cag cag aag gtc aag gec cag tgg 96 
Ser Ser Cys Cys Ser Tyr Gly Asp Gin Gin Lys Val Lys Ala Gin Trp 
20 25 30 

aac age etc tgg aac ace cct gac tec tec aca tec aag ate ate ttc 144 
Asn Ser Leu Trp Asn Thr Pro Asp Ser Ser Thr Ser Lys He He Phe 
35 40 45 



gga aag gaa gtc ttc gca cgc ttc ttc gag gtt gac ccc gag age aag 
Glv Lvs Glu Val Phe Ala Arg Phe Phe Glu Val Asp Pro Glu Ser Lys 
~ 55 60 



50 



age ctg ttc ggt cgc gtc aag gtt gaa gac ccc gac age ccc gag ttc 
Ser Leu Phe Gly Arg Val Lys Val Glu Asp Pro Asp Ser Pro Glu Phe 

75 80 



65 70 



gee gga cac gtg ate cgt gtt ttg ace ggt ctg gat ttg ate ate aac 
Ala Gly His Val He Arg Val Leu Thr Gly Leu Asp Leu He He Asn 
85 90 95 

ttg atg ggt gac gat gee atg gat gee gag ctg gee cac ctt aac ace 
Leu Met Gly Asp Asp Ala Met Asp Ala Glu Leu Ala His Leu Asn Thr 
100 105 HO 

cag cat ttg gee aga gag gga ate acc gga acc cac ttc ace gag atg 
Gin His Leu Ala Arg Glu Gly He Thr Gly Thr His Phe Thr Glu Met 
115 120 125 



192 



240 



288 



336 



384 
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ttc aag gtc ctg gat gga tec etc cgc cag gtt etc gag gag tac gat 432 

Phe Lys Val Leu Asp Gly Ser Leu Arg Gin Val Leu Glu Glu Tyr Asp 

130 135 140 



tec ctg tec tgg agg tac tgc ttc cgt ggt ctg ggc gee gee etc agg 
Ser Leu Ser Trp Arg Tyr Cys Phe Arg Gly Leu Gly Ala Ala Leu Arg 
145 * 150 155 160 

gat ggt etc ccc gca taa 
Asp Gly Leu Pro Ala 
165 



<210> 10 

<211> 165 

<212> PRT 

<213> Arenicola marina 

<400> 10 

Met Met Ser Val Val Phe Leu Leu Gly Leu Val Ala Tyr Ala Ser Ala 
1 .5 10 15 

Ser Ser Cys Cys Ser Tyr Gly Asp Gin Gin Lys Val Lys Ala Gin Trp 
20 25 30 

Asn Ser Leu Trp Asn Thr Pro Asp Ser Ser Thr Ser Lys He He Phe 
35 40 45 

Gly Lys Glu Val Phe Ala Arg Phe Phe Glu Val Asp Pro Glu Ser Lys 
50 55 60 

Ser Leu Phe Gly Arg Val Lys Val Glu Asp Pro Asp Ser Pro Glu Phe 
65 10 75 80 

Ala Gly His Val He Arg Val Leu Thr Gly Leu Asp Leu He He Asn 
85 90 95 

Leu Met Gly Asp Asp Ala Met Asp Ala Glu Leu Ala His Leu Asn Thr 
100 105 HO 

Gin His Leu Ala Arg Glu Gly He Thr Gly Thr His Phe Thr Glu Met 
115 120 125 

Phe Lys Val Leu Asp Gly Ser Leu Arg Gin Val Leu Glu Glu Tyr Asp 
130 135 140 

Ser Leu Ser Trp Arg Tyr Cys Phe Arg Gly Leu Gly Ala Ala Leu Arg 
145 150 155 160 

Asp Gly Leu Pro Ala 
165 



<210> 11 

<211> 771 

<212> ADN 

<213> Arenicola marina 



480 



498 



<220> 

<221> CDS 
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<222> (1)..(771) 
<223> 

<400> 11 

atg aag age tac gtg etc gtg tgc tgc etc gtg gtg ggg gec gtg gee 
Met Lys Ser Tyr Val Leu Val Cys Cys Leu Val Val Gly Ala Val Ala 
1 5 10 15 

tac ccc cac gag gtg atg cac cat gec gtt ggc gca aac cga atg tgc 
Tyr Pro His Glu Val Met His His Ala Val Gly Ala Asn Arg Met Cys 
20 25 30 

aag tgt gat gec ccg gca ggg aac gee gaa ace tec gee gac aga gag 
Lys Cys Asp Ala Pro Ala Gly Asn Ala Glu Thr Ser Ala Asp Arg Glu 
35 40 45 

cag agt cac act etc gat gag ttg ace cat cag ttg cac atg ctg cag 
Gin Ser His Thr Leu Asp Glu Leu Thr His Gin Leu His Met Leu Gin 
50 55 60 

caa gec tac gac ace ggc atg ggt cgt gtc gat gac gtg atg gag gac 
Gin Ala Tyr Asp Thr Gly Met Gly Arg Val Asp Asp Val Met Glu Asp 
65 ' 70 75 80 



age gag gtc ate aac gag ccg gtc tct ggc tac tgg age age gec gat 
Ser Glu Val He Asn Glu Pro Val Ser Gly Tyr Trp Ser Ser Ala Asp 
195 200 205 

agg age gee get atg ccc ccg gac age gec ggt cac ctt ggc ttt gtc 
Arg Ser Ala Ala Met Pro Pro Asp Ser Ala Gly His Leu Gly Phe Val 
210 215 220 



48 



96 



144 



192 



240 



288 



atg gac gac ctg tec cac agg ate gec gac cac gag aag gaa cac tgt 
Met Asp Asp Leu Ser His Arg He Ala Asp His Glu Lys Glu His Cys 
85 " 90 95 

aag aag tat aga gag ttc cag tgc ggt ggt gac cat cca aag tgc ate 
Lys Lys Tyr Arg Glu Phe Gin Cys Gly Gly Asp His Pro Lys Cys He 
100 105 HO 

teg aac etc etc gtc tgc gac ggt gac aac gac tgt gac aat gga get 
Ser Asn Leu Leu Val Cys Asp Gly Asp Asn Asp Cys Asp Asn Gly Ala 
115 120 125 

gat gag get cgt tgt gat gtg etc ace gag get ggt agt agt tgg act 
Asp Glu Ala Arg Cys Asp Val Leu Thr Glu Ala Gly Ser Ser Trp Thr 
130 " 135 140 

ggt act gtg gtc tac gat cac tgc ace aag cgt cgc cca gag ace atg 
Gly Thr Val Val Tyr Asp His Cys Thr Lys Arg Arg Pro Glu Thr Met 
145 150 ' 155 160 

aag etc age ate aag age gtg gat acc gta ccc ttc ttc acc acc cac 
Lys Leu Ser He Lys Ser Val Asp Thr Val Pro Phe Phe Thr Thr His 
165 170 175 

ccc aag gtc cgc ggt acc gtg ctt atg gag aag cac acc aag gac tac 576 
Pro Lys Val Arg Gly Thr Val Leu Met Glu Lys His Thr Lys Asp Tyr 
180 185 190 



336 



384 



432 



480 



528 



624 



672 
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tgc ate ttc cac ggc cac gac cac gac acc tgc act ggt etc etc acc 720 

Cys He Phe His Gly His Asp His Asp Thr Cys Thr Gly Leu Leu Thr 
225 230 235 240 

aag ggc aag gtc aca gat gee tgc gec gag ttc acc ttc cac agg gat 768 

Lys Gly Lys Val Thr Asp Ala Cys Ala Glu Phe Thr Phe His Arg Asp 
245 250 255 

771 

taa 



<210> 12 

<211> 256 

<212> PRT 

<213> Arenicola marina 

<400> 12 

Met Lys Ser Tyr Val Leu Val Cys Cys Leu Val Val Gly Ala Val Ala 
1 5 10 15 

Tyr Pro His Glu Val Met His His Ala Val Gly Ala Asn Arg Met Cys 
20 25 30 

Lys Cys Asp Ala Pro Ala Gly Asn Ala Glu Thr Ser Ala Asp Arg Glu 
35 40 45 

Gin Ser His Thr Leu Asp Glu Leu Thr His Gin Leu His Met Leu Gin 
50 55 60 

Gin Ala Tyr Asp Thr Gly Met Gly Arg Val Asp Asp Val Met Glu Asp 
65 70 75 80 

Met Asp Asp Leu Ser His Arg He Ala Asp His Glu Lys Glu His Cys 
85 90 95 

Lvs Lvs Tyr Arg Glu Phe Gin Cys Gly Gly Asp His Pro Lys Cys He 
100 105 HO 

Ser Asn Leu Leu Val Cys Asp Gly Asp Asn Asp Cys Asp Asn Gly Ala 
115 120 125 

Asp Glu Ala Arg Cys Asp Val Leu Thr Glu Ala Gly Ser Ser Trp Thr 
130 135 140 

Gly Thr Val Val Tyr Asp His Cys Thr Lys Arg Arg Pro Glu Thr Met 
145 150 155 160 

Lvs Leu Ser He Lys Ser Val Asp Thr Val Pro Phe Phe Thr Thr His 
165 1*70 175 

Pro Lys Val Arg Gly Thr Val Leu Met Glu Lys His Thr Lys Asp Tyr 
180 185 190 

Ser Glu Val He Asn Glu Pro Val Ser Gly Tyr Trp Ser Ser Ala Asp 
195 200 205 

Arq Ser Ala Ala Met Pro Pro Asp Ser Ala Gly His Leu Gly Phe Val 
210 215 220 

Cvs He Phe His Gly His Asp His Asp Thr Cys Thr Gly Leu Leu Thr 
225 230 235 240 
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Lvs Gly Lys Val Thr Asp Ala Cys Ala Glu Phe Thr Phe His Arg Asp 
245 250 255 



<210> 13 
<211> 376 
<212> ADN 

<213> Arenicola marina 
<220> 

<221> CDS 

<222> (1)..(375) 

<223> 

<400> 13 q 
gga cct ttg cag cgc etc ctg gtc aag acc cag tgg aac aag gtg tac 4b 
Gly Pro Leu Gin Arg Leu Leu Val Lys Thr Gin Trp Asn Lys Val Tyr 
15 10 15 

ggc acc age aag gtc agg gac gag gec gga cac gtc etc tgg aag get 96 
Gly Thr Ser Lys Val Arg Asp Glu Ala Gly His Val Leu Trp Lys Ala 
20 25 30 

att ttc gec cag gat ccc gag acc egg get etc ttc aag aga gtc aac 14 4 

He Phe Ala Gin Asp Pro Glu Thr Arg Ala Leu Phe Lys Arg Val Asn 
35 40 45 

ggt gac gac ate tac tct ccc gag ttc atg get cac age gec cgt gtc 
Gly Asp Asp He Tyr Ser Pro Glu Phe Met Ala His Ser Ala Arg Val 



192 



50 55 60 

ttg ggt ggc ctt gac att gee ate tec etc etc gac aac cag get gac 
Leu Gly Gly Leu Asp He Ala He Ser Leu Leu Asp Asn Gin Ala Asp 



65 70 



75 80 



ctt gac gtc gee ctg get cac ctt cac gtg cag cac gta gaa agg cac 
Leu Asp Val Ala Leu Ala His Leu His Val Gin His Val Glu Arg His 
85 90 95 

ate cca acc cgc tac ttc gat ctg ttc aag aac gee ctg atg gag tat 
He Pro Thr Arg Tyr Phe Asp Leu Phe Lys Asn Ala Leu Met Glu Tyr 
100 105 HO 

gee ccc age gec ctg gga cgc tgc ttt gat aag gac gca t 
Ala Pro Ser Ala Leu Gly Arg Cys Phe Asp Lys Asp Ala 
115 120 125 



240 



288 



336 



376 



<210> 14 

<211> 125 

<212> PRT 

<213> Arenicola marina 

<400> 14 

Gly Pro Leu Gin Arg Leu Leu Val 
1 5 

Gly Thr Ser Lys Val Arg Asp Glu 
20 



Lys Thr Gin Trp Asn Lys Val Tyr 
10 15 

Ala Gly His Val Leu Trp Lys Ala 
25 30 
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He Phe Ala Gin Asp Pro Glu Thr Arg Ala Leu Phe Lys Arg Val Asn 
35 40 45 

Gly Asp Asp He Tyr Ser Pro Glu Phe Met Ala His Ser Ala Arg Val 
50 55 60 

Leu Gly Gly Leu Asp He Ala He Ser Leu Leu Asp Asn Gin Ala Asp 
65 ' 70 75 80 

Leu Asp Val Ala Leu Ala His Leu His Val Gin His Val Glu Arg His 
85 90 95 

He Pro Thr Arg Tyr Phe Asp Leu Phe Lys Asn Ala Leu Met Glu Tyr 
100 105 110 

Ala Pro Ser Ala Leu Gly Arg Cys Phe Asp Lys Asp Ala 
115 120 125 



<210> 


15 






<211> 


288 






<212> 


ADN 






<213> 


Arenicola marina 


<220> 








<221> 


CDS 






<222> 


(1) . • 


(288) 




<223> 








<400> 


15 






tgc gga ccc 


ctt cag 


cgc 


Cys Gly Pro 


Leu Gin 


Arg 


1 




5 




tat gga age 


gga aac 


age 


Tyr Gly Ser 


Gly Asn 


Ser 



20 



cat gtc ttc cag cac teg 
His Val Phe Gin His Ser 
35 

cgc ggt gac aac ate cac 
Arg Gly Asp Asn He His 
50 

gtg etc ggt gga etc gac 
Val Leu Gly Gly Leu Asp 
65 70 

gtt ctg aac acg cag etc 
Val Leu Asn Thr Gin Leu 
85 



ctg aag gtc aag cgc cag 
Leu Lys Val Lys Arg Gin 
10 

agg gag gaa ttc gga cac 
Arg Glu Glu Phe Gly His 
25 

cct get gee cgc gac atg 
Pro Ala Ala Arg Asp Met 
40 

ace cca gca ttc atg gee 
Thr Pro Ala Phe Met Ala 
55 60 

atg tgc att gee ctt etc 
Met Cys He Ala Leu Leu 
75 

get cat ctt gee aag caa 
Ala His Leu Ala Lys Gin 
90 



tgg get gag get 48 
Trp Ala Glu Ala 
15 

ttc ate tgg tec 96 
Phe He Trp Ser 
30 

ttc aag cgc gtc 144 

Phe Lys Arg Val 

45 

cac gee ace cgt 192 
His Ala Thr Arg 



gat gat gaa ccc 240 
Asp Asp Glu Pro 
80 

cac gaa ace cgt 288 
His Glu Thr Arg 
95 



<210> 16 

<211> 96 

<212> PRT 

<213> Arenicola marina 
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cJs°GlyPro Leu Gin Arg Leu Lys Val Lys Arg Gin Trp Ala Glu Ala 
15 10 15 

Tvr Gly Ser Gly Asn Ser Arg Glu Glu Phe Gly His Phe He Trp Ser 
20 25 30 

His Val Phe Gin His Ser Pro Ala Ala Arg Asp Met Phe Lys Arg Val 
35 40 45 

Arg Gly Asp Asn He His Thr Pro Ala Phe Met Ala His Ala Thr Arg 
50 55 60 

Val Leu Gly Gly Leu Asp Met Cys He Ala Leu Leu Asp Asp Glu Pro 
65 " 70 75 80 

Val Leu Asn Thr Gin Leu Ala His Leu Ala Lys Gin His Glu Thr Arg 
85 90 95 



<210> 17 
<211> 360 
<212> ADN 

<213> Arenicola marina 
<220> 

<221> CDS 

<222> (1)..(360) 

<223> 

<400> 17 . . „ „ = „ .r, 

aag gtg aag cac caa tgg gtg cag gtg tac age ggc cat ggt tac gag 4B 
Lys Val Lys His Gin Trp Val Gin Val Tyr Ser Gly His Gly Tyr Glu 
1 5 10 I 5 

cgt gag gcg ttc ggc aga gag gtc ttc etc gag atg tac aac cag gca 96 
Arq Glu Ala Phe Gly Arg Glu Val Phe Leu Glu Met Tyr Asn Gin Ala 
20 25 30 

ccc aag gec aag gac etc ttc ace agg gtc agg ggc gag aac gtc ttc 144 
Pro Lys Ala Lys Asp Leu Phe Thr Arg Val Arg Gly Glu Asn Val Phe 
35 40 45 

tec ccc gag ttc gga gec cac atg gtc cgt gtg etc gga ggt etc gac 
Ser Pro Glu Phe Gly Ala His Met Val Arg Val Leu Gly Gly Leu Asp 
50 55 60 

atg tgc ate get ctg ctg tec gat gac ace gtc etc aac gee cag ctt 
Met Cys He Ala Leu Leu Ser Asp Asp Thr Val Leu Asn Ala Gin Leu 

act cac etc age acg cag cac aag gac cgt gga ate ccc aac gag tac 
£a His Leu Ser Thr Gin His Lys Asp Arg Gly He Pro Asn Glu Tyr 
85 90 95 

ttc gat gtg gtg aag gtc gee etc atg aag gtc gtc ccc ggc cac gtt 
Phe Asp Val Val Lys Val Ala Leu Met Lys Val Val Pro Gly Hxs Val 
100 105 11° 



192 



240 



288 



336 
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tea cac ttc gat ate ggc gcg tgg 
Ser His Phe Asp He Gly Ala Trp 
115 120 



<210> 18 

<211> 120 

<212> PRT 

<213> Arenicola marina 

<400> 18 



360 



Lys Val Lys His Gin Trp Val Gin Val Tyr Ser Gly His Gly Tyr Glu 

Arq Glu Ala Phe Gly Arg Glu Val Phe Leu Glu Met Tyr Asn Gin Ala 
20 25 30 

Pro Lys Ala Lys Asp Leu Phe Thr Arg Val Arg Gly Glu Asn Val Phe 
35 40 45 

Ser Pro Glu Phe Gly Ala His Met Val Arg Val Leu Gly Gly Leu Asp 
50 55 60 

Met Cvs He Ala Leu Leu Ser Asp Asp Thr Val Leu Asn Ala Gin Leu 
65 70 75 80 

Ala His Leu Ser Thr Gin His Lys Asp Arg Gly He Pro Asn Glu Tyr 
85 90 95 

Phe Asp Val Val Lys Val Ala Leu Met Lys Val Val Pro Gly His Val 
100 105 HO 

Ser His Phe Asp He Gly Ala Trp 
115 120 



<210> 19 
<211> 390 
<212> ADN 

<213> Arenicola marina 
<220> 

<221> CDS 

<222> (1) . . (390) 

<223> 

tqt°tgc 1 agt ata gag gac cgc aag gag gtc cag acg ctg tgg agt gag 
Cys Cys Ser He Glu Asp Arg Lys Glu Val Gin Thr Leu Trp Ser Glu 
1*5 1° 15 

ate tgg agt gee cag ttc act ggt cgc cgt gtc cag gtt gee cag get 
lie Trp Ser Ala Gin Phe Thr Gly Arg Arg Val Gin Val Ala Gin Ala 
20 25 30 

gtg ttc gag gac etc ttc cgc cgc gac ccc gag tec aag aac ctg ttc 
Val Phe Glu Asp Leu Phe Arg Arg Asp Pro Glu Ser Lys Asn Leu Phe 
35 40 45 



48 



96 



144 
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aaa cac ate aat gtt gac gac atg aac age ccc gaa ttc cac get cac 192 
III Arg Val Asn Sal Asp Asp Met Asn Ser Pro Glu Phe His Ala His 
50 55 60 

tge ate cgt gtt gtc aac ggt ctt gac acc gtg ate ggt etc ctt gac 240 
Cys lie Arg Val Val Asn Gly Leu Asp Thr Val He Gly Leu Leu Asp 
65 " 70 75 80 

gac ccc gac acc ctg aag tec cag etc gag cac ttg gee cag cag cac 288 
Asp Pro Asp Thr Leu Lys Ser Gin Leu Glu Hrs Leu Ala Gin Gin Hrs 
85 90 

aaa aaa cat aat ggc ate cac aag acc cac ttc gac gag atg tec cac- 
Lys Glu Arg Asp Gly He His Lys Thr His Phe Asp Glu Met Ser H.s 
100 105 110 

gee ttc ggc gee gtc atg ccc cag gtc age age tgt ttc aac ccc gat 384 
Ma Phe Gly Ala Val Met Pro Gin Val Ser Ser Cys Phe Asn Pro Asp 
115 120 125 

390 

gca tga 
Ala 



336 



<210> 20 
<211> 129 
<212> PRT 

<213> Arenicola marina 

Cys°Cy S 2 Ser He Glu Asp Arg Lys Glu Val Gin Thr Leu Trp Ser Glu 
1 5 10 ib 

lie Trp Ser Ala Gin Phe Thr Gly Arg Arg Val Gin Val Ala Gin Ala 
20 25 30 

Val Phe Glu Asp Leu Phe Arg Arg Asp Pro Glu Ser Lys Asn Leu Phe 
35 40 45 

Lys Arg Val Asn Val Asp Asp Met Asn Ser Pro Glu Phe His Ala His 
Y 50 55 60 

Cys He Arg Val Val Asn Gly Leu Asp Thr Val He Gly Leu Leu Asp 
Asp Pro Asp Thr Leu Lys Ser Gin Leu Glu His Leu Ala Gin Gin His 



85 



Lys Glu Arg Asp Gly He His Lys Thr His Phe Asp Glu Met Ser His 
100 105 110 

Ala Phe Gly Ala Val Met Pro Gin Val Ser Ser Cys Phe Asn Pro Asp 
115 



120 125 



Ala 



<210> 21 
<211> 20 
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<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PCR- 
<220> 

<221> misc_f eature 
<222> (9).. (9) 
<223> A, G, C ou T 

<220> 

<221> mi sc_f eature 

<222> (12).. (12) 

<223> A, G, C ou T 

<400> 21 

gartgyggnc cnttrcarcg 



<210> 22 

<211> 21 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PCR 

<400> 22 

ctcctctcct ctcctcttcc t 



<210> 23 

<211> 17 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PCR 
<220> 

<221> misc_f eature 

<222> (6).. (6) 

<223> A, G, C ou T 

<220> 

<221> misc__f eature 

<222> (12) . . (12) 

<223> A, G, C ou T 

<400> 23 

tgyggnathc tncarcg 



<210> 24 

<211> 18 

<212> ADN 

<213> artificial sequence 



<220> 

<223> amorce PCR 
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<220> 

<221> misc_feature 

<222> (6) . . (6) 

<223> inosine 

<220> 

<221> misc_feature 

<222> (12) . . (12) 

<223> A, G, C ou T 

<400> 24 

aargtnaarc anaactgg 



<210> 25 

<211> 20 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PCR 

<400> 25 

tgytgyagya thgargaycg 



<210> 26 

<211> 20 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PCR 
<220> 

<221> misc_feature 

<222> (6) . . (6) 

<223> A, G, C ou T 

<220> 

<221> misc_feature 

<222> (15) . . (15) 

<223> A, G, C ou T 



<400> 


26 


aargtnatht tyggnagrga 


<210> 


27 


<211> 


20 


<212> 


ADN 


<213> 


artificial sequence 


<220> 




<223> 


amorce PCR 


<220> 




<221> 


misc feature 


<222> 


(15) . . (15) 


<223> 


A, G, C ou T 
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<220> 

<221> misc_feature 

<222> (18) . . (18) 

<223> A, G, C ou T 

<400> 27 

garcaycart gyggnggnga 



<210> 28 

<211> 21 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PCR 
<220> 

<221> misc_f eature 

<222> (4).. (4) 

<223> A, G, C ou T 

<220> 

<221> misc_f eature 

<222> (7).. (7) 

<223> A, G, C ou T 

<400> 28 

ccangcntcy ttrtcraagc a 



<210> 29 

<211> 19 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PCR 
<220> 

<221> misc_f eature 

<222> (2).. (2) 

<223> A, G, C ou T 

<220> 

<221> misc__f eature 

<222> (8).. (8) 

<223> A, G, C ou T 

<220> 

<221> misc_f eature 

<222> (11).. (ID 

<223> A, G, C ou T 

<220> 

<221> mi sc_f eature 

<222> (14) . . (14) 

<223> A, G, C ou T 
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<400> 29 

antgyggncc nctncarcg 19 



<210> 30 

<211> 18 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PCR 
<220> 

<221> misc_f eature 

<222> (4).. (4) 

<223> A, G, C ou T 

<220> 

<221> misc_f eature 

<222> (7).. (7) 

<223> A, G, C ou T 

<400> 30 

ccangcnccd atrtcraa 



<210> 31 

<211> 20 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PCR 
<220> 

<221> misc_f eature 

<222> (3).. (3) 

<223> A, G, C ou T 

<220> 

<221> misc_f eature 

<222> (6).. (6) 

<223> A, G, C ou T 



<400> 31 

cangcnycrc trttraarca 



20 
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